ReLU e o genocídio de neurônios: Como uma função de ativação pode criar regiões mortas em uma rede neural | by Alexandre Esposte Santos

A escolha de uma função de ativação no desenvolvimento de uma rede neural é um passo crucial para a obtenção de bons resultados. As funções de ativação são as grandes responsáveis pela incorporação de não linearidades em nossa rede, caso contrário, só seriamos capazes de tratar problemas linearmente separáveis.

Na listagem a seguir, apresentamos algumas funções de ativações mais conhecidas e utilizadas:

Sigmoide
Tangente hiperbólica
Linear
ReLU
Softmax

vale ressaltar que essas são algumas das funções que mais vemos por ai, no entanto, existem muitas outras que podemos considerar.

Neste artigo, como sugere o título, focaremos nossos esforços em analisar características fundamentais atreladas a função de ativação ReLU (Rectified Linear Unit, ou Unidade Linear Retificada em português).

O primeiro passo consiste em definirmos essa função de ativação, essa parte é essencial para que possamos ir adiante na nossa linha de raciocínio. Desse modo, a função ReLU pode ser expressa da seguinte maneira,