learning_rate

czym jest learning rate? ⭐

To parametr określający wielkość kroku podczas aktualizacji wag w algorytmach optymalizacji (np. gradient descent).
Zbyt duży learning rate: model "przeskakuje" minimum, nie uczy się stabilnie.
Zbyt mały learning rate: model uczy się bardzo wolno.

Najczęściej dobiera się eksperymentalnie (testując różne wartości).
Typowe wartości: 0.1, 0.01, 0.001 (ale zależy od problemu i danych).
Można stosować harmonogramy (learning rate schedule), np. zmniejszać learning rate w trakcie uczenia.

learning_rates = [1, 0.1, 0.01, 0.001]
for lr in learning_rates:
    # uruchom gradient descent z danym learning rate
    ...