lunes, 20 de marzo de 2017

Segunda parte Aprendizaje neuronal


En la monografía de Matich, publicada el año 2001 con el título “Redes neuronales: Conceptos básicos y aplicaciones”, se menciona que las redes neuronales son más que otra forma de emular ciertas características propias de los seres humanos, como la capacidad de memorizar y de asociar hechos. Si se examinan con atención aquellos problemas que no pueden expresarse a través de un algoritmo, se observará que todos ellos tienen una característica en común: La experiencia. El hombre es capaz de resolver estas situaciones acudiendo a la experiencia acumulada. Así, parece claro que una forma de aproximarse al problema consista en la construcción de sistemas que sean capaces de reproducir esta característica humana. En definitiva, las redes neuronales no son más que un modelo artificial y simplificado del cerebro humano, que es el ejemplo más adecuado del que se dispone para un sistema que es capaz de adquirir conocimiento a través de la experiencia. Una red neuronal es un nuevo sistema para el tratamiento de la información, cuya unidad básica de procesamiento está inspirada en la célula fundamental del sistema nervioso humano: La neurona. El pensamiento tiene lugar en el cerebro, que consta de billones de neuronas interconectadas. Así, el secreto de la “inteligencia”, sin importar como se defina, se sitúa dentro de estas neuronas interconectadas y de su interacción. También, es bien conocido que los seres humanos son capaces de aprender. Aprendizaje significa que aquellos problemas que inicialmente no pueden resolverse, pueden ser resueltos después de obtener más información acerca del problema.

En la tesis de Villaseñor, publicada el año 2004 con el título “Análisis inteligente de datos con redes neuronales artificiales”, se menciona que para definir una red neuronal, no solo basta tener una arquitectura, también es necesaria la determinación de un proceso de aprendizaje. El proceso de aprendizaje en una red neuronal puede ser visto como un problema de actualización de los pesos sinápticos de las neuronas de manera tal que la red neuronal mejore la forma en que realiza cierta tarea específica. Estas mejoras en el desempeño de una red neuronal son logradas a lo largo del proceso de entrenamiento y mediante la actualización iterativa del los pesos sinápticos, los cuales están representados por un vector denominado vector de pesos. En este proceso, se modifican los vectores de pesos, de manera que el comportamiento de la red neuronal se adapte y alcance un desempeño óptimo. Durante el proceso de aprendizaje, los pesos de las conexiones de la red sufren modificaciones, por lo tanto, se puede afirmar que este proceso ha terminado, la red ha aprendido, cuando los valores de los pesos permanecen estables. Un aspecto importante respecto al aprendizaje de las redes neuronales es el conocer cómo se modifican los valores de los pesos, es decir, cuáles son los criterios que se siguen para cambiar el valor asignado a las conexiones cuando se pretende que la red aprenda una nueva información. Hay dos métodos de aprendizaje importantes que pueden distinguirse: Aprendizaje supervisado y aprendizaje no supervisado.

En la tesis de grado de Andrade, publicada el año 2013 con el título “Estudio de los principales tipos de redes neuronales y las herramientas para su aplicación”, se menciona que el aprendizaje supervisado se caracteriza porque el proceso de aprendizaje se realiza mediante un entrenamiento controlado por un agente externo, supervisor o maestro, que determina la respuesta que debería generar la red a partir de una entrada determinada. El supervisor controla la salida de la red y en caso de que ésta no coincida con la deseada, se procederá a modificar los pesos de las conexiones, con el fin de conseguir que la salida obtenida se aproxime a la deseada. En este tipo de aprendizaje se suelen considerar, a su vez, tres formas de llevarlo a cabo, que dan lugar a los siguientes aprendizajes supervisados: (1) Aprendizaje por corrección de error. Consiste en ajustar los pesos de las conexiones de la red en función de la diferencia entre los valores deseados y los obtenidos a la salida de la red, es decir, en función del error cometido en la salida. (2) Aprendizaje por refuerzo. Se trata de un aprendizaje supervisado, más lento que el anterior, que se basa en la idea de no disponer de un ejemplo completo del comportamiento deseado, es decir, de no indicar durante el entrenamiento exactamente la salida que se desea que proporcione la red ante una determinada entrada. En el aprendizaje por refuerzo la función del supervisor se reduce a indicar mediante una señal de refuerzo si la salida obtenida en la red se ajusta a la deseada, y en función de ello se ajustan los pesos basándose en un mecanismo de probabilidades. (3) Aprendizaje estocástico. Consiste básicamente en realizar cambios aleatorios en los valores de los pesos de las conexiones de la red y evaluar su efecto a partir del objetivo deseado y de distribuciones de probabilidad.

Por su parte Matich, en la monografía citada, menciona que las redes con aprendizaje no supervisado, no requieren influencia externa para ajustar los pesos de las conexiones entre sus neuronas. La red no recibe ninguna información por parte del entorno que le indique si la salida generada en respuesta a una determinada entrada es o no correcta. Estas redes deben encontrar las características, regularidades, correlaciones o categorías que se puedan establecer entre los datos que se presenten en su entrada. En cuanto a los algoritmos de aprendizaje no supervisado, en general se suelen considerar dos tipos, que dan lugar a los siguientes aprendizajes: (1) Aprendizaje hebbiano. Esta regla de aprendizaje es la base de muchas otras, la cual pretende medir la familiaridad o extraer características de los datos de entrada. El fundamento es una suposición bastante simple: Si dos neuronas toman el mismo estado simultáneamente, ambas activas o ambas inactivas, el peso de la conexión entre ambas se incrementa. (2) Aprendizaje competitivo y comparativo. Se orienta a la agrupación o clasificación de los datos de entrada. Como característica principal del aprendizaje competitivo se puede decir que, si un patrón nuevo se determina que pertenece a una clase reconocida previamente, entonces la inclusión de este nuevo patrón a esta clase matizará la representación de la misma. Si el patrón de entrada se determinó que no pertenece a ninguna de las clases reconocidas anteriormente, entonces la estructura y los pesos de la red neuronal serán ajustados para reconocer la nueva clase.

No hay comentarios:

Publicar un comentario