Minería de datos para negocios

Figura 1 Minería de datos y disciplinas relacionadas

La minería de datos o “Data Mining” representa un mundo de oportunidades para cualquier tipo de negocio en general y para el sector asegurador en particular, desde el punto en el que es capaz de detectar patrones de conducta en sus clientes y predecir su comportamiento en base a analizar grandes cantidades de información dispersa para darle sentido y convertirla en conocimiento.

En un contexto en el que el volumen de información crece sin parar, se estima que se duplica cada año aproximadamente, la minería de datos cobra una relevancia especial, al menos así lo consideran más del 80% de las de las empresas que aplican Inteligencia Empresarial (Fuente: Forbes)

La minería de datos tiene múltiples aplicaciones en el sector seguros, como por ejemplo los siguientes:

  1. Clasificación de los clientes por probabilidad de “Churn” (no renovar con la empresa)
  2. Segmentación de los clientes, por ejemplo, para identificar a los más rentables
  3. Determinación personalizada de ofertas de productos (cross-selling/up-selling)

Definición

Más que una nueva disciplina, la minería de datos se ubica en la intersección de varias áreas (ver figura 1).

La minería de datos (MD) es “un proceso de identificación y extracción de patrones no triviales, útiles, novedosos, entendibles, a partir de conjuntos de datos almacenados en bases de datos estructuradas.”:

  • Por Proceso, se entiende que existen varias etapas iterativas.
  • No triviales, implica que algún tipo de experimentación o búsqueda está involucrada.
  • Novedoso, significa que los patrones no son previamente conocidos por el usuario.
  • Entendible, significa que los resultados deben ofrecer revelaciones para la alta dirección de la empresa.

Útiles, en el sentido que estos resultados se pueden implantar y generar algún tipo de beneficio para el negocio.

¿Por qué minería de datos?

Las últimas décadas se han caracterizado por generar masivas cantidades de datos, en particular, gracias al desarrollo de la tecnología de información en los negocios, como, por ejemplo:

  1. Transacciones de negocios en línea y físicos.
  2. Datos almacenados en las distintas redes sociales.
  3. Datos generados por el uso de los teléfonos móviles.
  4. Datos generados por el Internet de las cosas – smart cities – entre muchos otros.

La minería de datos es un nuevo paradigma para manejar esta cantidad de datos, con una infinidad de variables y atributos, y formular algoritmos de búsqueda de patrones.

Por otro lado, el costo de almacenamiento de los datos ha venido bajando, gracias a los avances de la tecnología informática, a la vez que aumenta la capacidad y rapidez de procesamiento.  Esta data se está almacenando en Data Warehouses (repositorios de datos estructurados), tanto a nivel local, como en la “nube”.

Finalmente, la competencia global se hace cada vez más intensa, debido a la dinámica cambiante del consumidor, en un mercado cada vez más saturado. Esto hace necesaria un mayor conocimiento del comportamiento del cliente y sus patrones de conducta.

Por otra parte, existe una gran variedad de software especializado en minería de datos, cada vez más amigables para el usuario, y muchos de ellos son “Software Libre”. Todo lo anterior facilita la implantación de la minería de datos en los negocios, otorgando una ventaja competitiva a aquellos que lo hagan, ya que podrán ser más eficientes y efectivos en sus programas de marketing, gestión del riesgo, etc.

Procesos de la minería de datos

A fin de llevar a cabo de manera sistemática los proyectos de minería de datos se han desarrollado varios modelos de procesos o flujos sugeridos, para maximizar las probabilidades de éxito de estos. A continuación, describimos un par de ellos:

Modelo CRISP

Surgido en Europa a mediados de los años 90, es uno de los modelos más conocidos y populares. En la figura 3 podemos observar los seis pasos que lo constituyen:

  1. Entendimiento del negocio. El elemento más básico y esencial es entender para qué es el estudio que estamos por hacer. Debemos tener claridad en los objetivos y de lo que espera la gerencia de la empresa de los resultados.
  2. Entendimiento de la Data. Luego, se requiere ubicar la data necesaria para lograr los objetivos planteados. Probablemente se encuentre en varias bases de datos y en distintos formatos. Estos datos pueden ser de diversa índole, como transaccionales (compras, reclamos, frecuencia, fechas, lugares y montos de compras), demográficos (sexo, edad, ingresos, educación, etc.), estilos de vida (hobbies, clubes, etc.). También se puede acudir a bases de datos de terceros, que ponen a disposición data de otras fuentes, como, por ejemplo, las redes sociales.
  3. Preparación de la Data. Esta fase del estudio es sin duda la más tediosa y consumidora de tiempo (se estima que esta fase toma entre 80 y 90% del tiempo total del estudio). Consiste en tomar los datos seleccionados según el punto anterior, y “limpiarlos” (eliminar errores obvios y/o inconsistencias, completar datos faltantes, “normalizar” los datos, crear nuevas variables a partir de las existentes, etc.), y colocar esa data en un formato estructurado de tal forma que el software de minería de datos pueda utilizarlos.
  4. Creación de Modelo(s). En función de los objetivos fijados, se seleccionan las distintas herramientas disponibles para tal fin (por ejemplo, si queremos segmentar los clientes, podemos seleccionar “K-means cluster análisis”, redes neuronales, y otras). En efecto, no existe una herramienta óptima para todos los casos, por lo tanto, debemos probar con todas las disponibles y seleccionar la más adecuada, veremos más adelante cómo hacer esta selección.
  5. Entrenamiento y evaluación de los modelos. Una vez aquí, evaluamos los resultados de los modelos, en términos de qué tan precisos y generalizables son. Esa evaluación se hace con datos no utilizados para el entrenamiento, aplicándole el modelo a esos datos, y comparando los resultados del modelo con los resultados reales. Puede ocurrir que, en esta fase, se decida volver a alguna de las etapas anteriores, para redefinir el problema, data necesaria u otros y empezar de nuevo.
  6. Despliegue. Una vez seleccionados el/los modelo(s), la idea es llevar a la práctica del negocio los conocimientos adquiridos. Esto puede ser desde un simple reporte, hasta la incorporación de modelos sofisticados de clasificación de clientes en el CRM de la empresa, todo en función de los objetivos iniciales del estudio.
Figura 3 Proceso de la minería de datos – Modelo CRISP

Modelo KDD (Knowledge Discovery in Database)

Como se puede observar en la figura 4, este modelo considera, de manera similar al modelo CRISP, las fases de Recopilación de Data, Limpieza de Datos, Transformación de Datos, Minería de Datos, hasta llegar al Conocimiento deseado.

Figura 4 Proceso de la minería de datos – Modelo KDD (Knowledge Discovery in Database)

descubras más detalles sobre el programa ejecutivo “Aseguradoras Data Driven” desarrollado bajo la alianza de Community of Insurance y Unikemia y del que Gilbert Bergna es director académico y profesor.

Descargar folleto

Unikemia es una institución educativa que ofrece programas especializados en formatos flexibles e interactivos.

Deja una respuesta

Tu dirección de correo electrónico no será publicada.

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.

Abrir chat
Hola 👋
¿En qué podemos ayudarte?