niits

2025-12-16 02:08:55 +08:00 · 2025-01-22 21:39:29 +01:00
parent 4098c3bd2f
commit 0bb001121e
2 changed files with 4 additions and 4 deletions
--- a/llms/mlx_lm/tuner/orpo_trainer.py
+++ b/llms/mlx_lm/tuner/orpo_trainer.py
@@ -312,7 +312,7 @@ def train_orpo(
            if rank == 0:
                print(
                    f"Iter {it}: "
-                    f"Val loss {val_loss:.3f}, "
+                    f"Val loss {val_loss:.8f}, "
                    f"Val chosen reward {val_rewards[0]:.3f}, "
                    f"Val rejected reward {val_rewards[1]:.3f}, "
                    f"Val took {val_time:.3f}s",
@@ -353,7 +353,7 @@ def train_orpo(
            
            if rank == 0:
                print(
-                    f"Iter {it}: Train loss {train_loss:.3f}, "
+                    f"Iter {it}: Train loss {train_loss:.8f}, "
                    f"Chosen reward {train_rewards[0]:.3f}, "
                    f"Rejected reward {train_rewards[1]:.3f}, "
                    f"Learning Rate {learning_rate:.3e}, "