En el campo del Machine Learning o Aprendizaje Automático, hay varios tipos de aprendizaje. Aunque hay varias posibles maneras de clasificarlos, la más conocida es la siguiente:
Algoritmos supervisados y algoritmos no supervisados.
En los próximos párrafos veremos la diferencia entre ambos, y sus respectivos campos de aplicación en los negocios.
Aprendizaje No Supervisado
El aprendizaje no supervisado es el que se aplica cuando no sabemos, o cuando no existe la respuesta correcta (no podemos “supervisar” el resultado).
Por ejemplo, si queremos segmentar nuestros clientes, con base en los beneficios que buscan en nuestros productos, algoritmos como el K-means (k-medias), o DBSCAN, detectan patrones en la data, en este caso de agrupación de los clientes por su similitud en sus respuestas a la importancia de los beneficios para ellos, por ejemplo, y nos proponen soluciones (número de segmentos y sus integrantes).
Estos son procesos más complejos, por la naturaleza exploratoria del método, y el criterio del analista es fundamental en la selección de la mejor solución.
Otro algoritmo muy utilizado en Machine Learning es el Principal Component Analysis (PCA), o Análisis de Componente Principales.
En este caso se busca reducir dimensiones (variables), para simplificar el análisis, y hacer más eficiente el proceso. Tomemos el caso anterior de la segmentación de clientes por beneficios. Resulta que en el cuestionario preguntamos por unos 100 atributos del producto/servicio. Se puede agrupar a los clientes por sus respuestas a estas 100 preguntas, pero quizás sería más interesante ver si estas preguntas conforman grupos de preguntas, (co-)relacionadas entre sí. Esto es lo que hace el PCA, reduciendo de 100 variables a unas pocas (2 o 3 típicamente), para luego aplicar el algoritmo de segmentación con solo este reducido número de variables, en lugar de las 100 originales.
Otro algoritmo No supervisado muy utilizado es el de Asociación, o “Market Basket Analysis”. En este caso, la data es, por ejemplo, el conjunto de transacciones en un supermercado, o similar.
Tenemos las transacciones de un período determinado, con los productos que fueron comprados en la misma transacción.
El objetivo aquí es determinar qué productos tienden a ser comprados simultáneamente. Esto permite recomendar a un nuevo cliente, con ciertos productos en su “carrito de mercado”, otros productos que estadísticamente pudieran también ser comprados por él. Es una de las bases para construir un “Motor de Recomendación” conocido, como los que utilizan empresas como Amazon, Netflix y otras.
Con esto terminamos nuestro resumen de Algoritmos Supervisados vs No Supervisados.