Cómo aprenden las máquinas: Aprendizaje Automático

Cómo aprenden las máquinas: Aprendizaje Automático

octubre 14, 2020 0 Por Carolcfr

Aprendizaje Automático, es una rama de la computación y además de la inteligencia artificial. Se puede definir como la capacidad que tienen las máquinas de aprender automáticamente por sí mismas.

Cuando decimos ‘aprender’, nos referimos a un ordenador que tiene acceso a millones de datos, y todo este aprendizaje automático se solapa con el de la estadística inferencial, que es una de las disciplinas que se basan en el análisis de datos. A partir de ellos, su algoritmo es capaz de establecer patrones de comportamiento. Pero lo cierto es que este tipo de aprendizaje está presente todos los días en nuestras vidas: las máquinas están aprendiendo por sí mismas. Sistemas de reconocimiento de voz como Siri de iPhone o Alexa de Amazon,  incluso los autocorrectores de los procesadores de palabras, que pueden predecir tu forma de escribir, son algunos de los ejemplos.

Aprendiendo a aprender

Estamos enseñando a las máquinas a aprender cosas nuevas, y el proceso es tan simple cómo enseñar a un niño a aprender los números: primero se procede a hacer distintos trazos y a partir de dichos trazos se forman los números. Es un proceso de  aprendizaje basado en la repetición, haciendo que los niños llenen hojas completas.

El  proceso de aprendizaje de las máquinas es muy similar al patrón humano. Los científicos de datos intentan reproducir eso, al establecer repeticiones de prueba y error los ordenadores asimilan modelos y características de los objetos o reconocen las consecuencias de antecedentes similares. El método científico conceptualizado mediante técnicas matemáticas, son algunas de las técnicas que utilizan los científicos para conseguirlo.

En un plano teórico, podemos hablar de tres grandes aproximaciones al  Aprendizaje Automático: aprendizaje supervisado, aprendizaje no supervisado y aprendizaje por refuerzo.

La supervisión

Para que un ordenador aprenda ciertas rutinas, se le debe proporcionar cierta cantidad de datos y realidades que apunten a una verdad absoluta, donde no se dude de su respuesta, con una larga secuencia de preguntas y respuestas predefinidas. El ordenador debe aprender de esta rutina con la premisa de que, dada una nueva pregunta, el ordenador tenga la capacidad de predecir la respuesta a lo preguntado.

A través del aprendizaje supervisado, presentan algoritmos conocidos que mejoran las diferencias y las comprenden. Luego, dada una nueva imagen nunca antes vista, la máquina podrá reconocer el objeto presentado.

Con este modelo, puede clasificar mucho más que imágenes, puede descubrir  objetos, detectar rostros y expresiones faciales. Igualmente con estos algoritmos otros tipos de datos son validados, como la voz y el texto.

Aprendizaje no supervisado

En el aprendizaje no supervisado, se utiliza un conjunto de ejemplos  formados únicamente por entradas al sistema. En este caso no existe un conocimiento de lo que es representado y se confía en que sea la propia IA la que determine sus características comunes.

Las variables aleatorias son tratadas como un conjunto de objetos, de esta forma se revelan automáticamente las características en la red, la correlación de los datos, la categorización y las regularidades; es así como los trata el aprendizaje no supervisado.

Las limitaciones no se hacen esperar en este sistema, su aplicación se basa en proyectos en donde su complejidad no sea tan relevante, se consideran la agrupación y las características relacionadas como factores importantes.

Aprendizaje semisupervisado

El sistema debe tener la capacidad de responder bien sea datos marcados como no marcados, por ello este método combina los dos aprendizajes, el supervisado no el no supervisado.

Aprendizaje por refuerzo

El aprendizaje por refuerzo aplica la psicología conductista y se basa en un sistema de prueba y error basado en la obtención de algún tipo de reconocimiento o recompensa.

En vez de darle instrucciones de cómo debe ser el algoritmo, este aprende a comportarse en un entorno determinado, tomando unas reglas mínimas en función a la recompensa que obtiene a cambio. Optimizar el comportamiento y tomando decisiones que llevan a tener la recompensa de las mejores opciones tomadas, es el objetivo de estos algoritmos. En otras palabras, que reconozcan las señales.

Modelos para resolver una tarea

Modelos geométricos, son instancias construidas en el espacio que pueden tener múltiples dimensiones, donde la decisión lineal de los datos es separable.

Modelos probabilísticos, intentan definir la probabilidad que describe la función que une los valores de las características con los de valores determinados. La estadística bayesiana, es uno de los conceptos claves para este modelo.

Modelos lógicos, transforman las probabilidades en reglas y las organizan en forma de árbol de decisión.

Importancia del aprendizaje automático

Su principal importancia radica en explorar los beneficios que ha dejado ver el big data. A largo plazo se puede ver su valor estratégico, reduciendo el tiempo para establecer nuevos pronósticos. Comparándose con la rapidez del  aprendizaje humano el Machine Learning puede acortar los procesos que requieren estudio.

Con un sistema inteligente, se pueden detectar fraudes, desviaciones de capitales o grandes rentabilidades más rápido que un humano, haciendo que las finanzas estén es su mejor momento y haciendo que el aprendizaje automático acceda a nuevos horizontes del conocimiento.

Principales algoritmos del Aprendizaje Automático

Algoritmos basados en ejemplos: llamados algoritmos de instancias, la memoria es la base del aprendizaje.  Es en esa base de datos donde se elabora un modelo de aprendizaje. A medida que se agregan datos, se obtendrán similitudes con datos ya existentes.

Algoritmos de árbol de decisión: es una herramienta práctica que te permite visualizar a través de gráficos, los pros y los contras de cierta decisión.

Algoritmos de regresión: también llamados lineales, son los encargados de predecir valores. Relacionan variables para evitar errores y así buscan las más apropiadas.

Algoritmos Bayesianos: una red bayesiana, red de creencia o modelo acíclico dirigido, es un modelo probabilístico que representa una serie de variables de azar y sus independencias condicionales a través de un grafo acíclico dirigido.

Algoritmos de agrupación: su trabajo es agrupar información de datos, que no tienen características propias. De tal forma, su tarea es realizar diferencias entre los datos, para dar a conocer las características comunes.

Algoritmos de aprendizaje profundo: son capaces de reconocer rostros de humanos, animales y algunos objetos que estén dentro de una imagen. Valiéndose de las diferentes capas que poseen, tienen la capacidad de almacenar toda la información como si fueran redes de neuronas que se conectan entre sí.

Algoritmos de reducción de dimensión: simplifican o reducen una gran cantidad de datos muy complejos, es decir, los comprimen, por eso, utiliza algoritmos no supervisados.