Методы ускорения обучения нейронной сети. Скорость обучения

Алгоритм обратного распространения ошибки является одним из методов обучения многослойных нейронных сетей прямого распространения. Сегодня нейронные сети успешно используются при решении сложных практических задач.

В классическом варианте алгоритма обратного распространения ошибки формула коррекции весовых коэффициентов, выглядит следующим образом:

w_{p-q}(i+1)~=~w_{p-q}(i)~+~eta delta_{q}OUT_{p}

где:

  • i – номер текущей итерации обучения;
  • w_{p-q} – величина синаптического веса, соединяющего нейрон p с нейроном q;
  • eta – коэффициент «скорости обучения», управляет величиной изменения весов;
  • delta_{q} – ошибка q-нейрона;
  • OUT_{p} – выход нейрона p.

Здесь eta – константа. При очень маленьких значениях eta обучение нейронной сети будет проходить медленно. При очень больших значениях eta возникает вероятность того, что в момент достижения минимума функции ошибки E~=~f(W) нейронная сеть не сможет попасть в этот минимум и будет бесконечно долго «прыгать» справа и слева от него, производя перерасчеты весовых коэффициентов.

Функция ошибки нейронной сети

Выбор некоторого среднего значения eta для всего процесса обучения не позволит достигнуть оптимального множества весовых коэффициентов за минимальное количество шагов. Становится очевидным, что динамическое управление величиной eta может серьезно повысить эффективность обучения нейронной сети методом обратного распространения ошибки.

Присвоение eta большего значения в момент начала обучения позволит получить более быстрое приближение к области, где находится оптимальное множество весовых коэффициентов. А для того, чтобы нейронная сеть не «проскочила» минимум функции ошибки E~=~f(W) необходимо в процессе обучения уменьшать значение eta. Можно, например, по следующей простой формуле:

eta_{t+1}~=~x eta_{t}

где:

  • x – скорость уменьшения eta.

Стоит отметить, что существуют более сложные механизмы ускорения обучения нейронной сети, позволяющие изменять скорость обучения каждого отдельного нейрона, исходя из величины его ошибки на предыдущей итерации.

Динамическое управление скоростью обучения нейронной сети в большинстве случаев позволяет значительно повысить эффективность работы алгоритма обратного распространения.

Прокрутить вверх