6 de may de 2026
Tres preguntas a responder antes de avanzar con machine learning
¿Te interesa apoyarte en modelos machine learning? En este artículo revisamos tres temas que definen el éxito de estos modelos.

Cada vez más empresas ven el valor de implementar modelos de machine learning para automatizar análisis complejos y mejorar la toma de decisiones.
La conversación rápidamente llega a herramientas, proveedores y presupuestos.
Pero hay temas importantes qué responder primero. El éxito de un modelo predictivo depende, más que de la tecnología, de tres condiciones que deben existir antes de arrancar.
1. ¿Está el problema definido con la precisión suficiente para modelarlo?
No basta con tener claro el objetivo general. "Quiero predecir el riesgo de fraude o de quiebre de inventario" no es suficiente para definir modelos predictivos útiles.
Dos preguntas que ayudan a llegar al nivel correcto de definición:
- ¿El problema es el mismo para todos los clientes, productos, tiendas o hay segmentos con dinámicas distintas?
Por ejemplo, un banco que gestiona portafolios de crédito de consumo, hipotecario y empresarial, va a necesitar modelos separados. O una empresa del sector retail que vende diferentes productos en diferentes ciudades y barrios, tendrá que crear modelos por ubicación y líneas de producto con dinámicas similares.
Intentar capturar todo en un solo modelo generalmente produce predicciones pobres en todos los casos. Sesgos indeseables.
- ¿Qué decisión concreta va a soportar el modelo, con qué horizonte temporal y en qué momento?
Un modelo de scoring crediticio que apoya la aprobación inicial de un crédito es distinto a uno que monitorea el riesgo de una cartera existente. El primero trabaja con datos del solicitante en el momento de la solicitud. El segundo con comportamiento acumulado a lo largo del tiempo. Son modelos distintos, con usos y criterios de éxito distintos.
Entre más específica es la pregunta, más útil es la respuesta que el modelo puede dar.
2. ¿Tienes los datos para responder la pregunta?
Acá se complican más las cosas.
No se trata de tener muchos datos, sino de tener los correctos en condiciones de ser usados. Si están dispersos en varios sistemas, son inconsistentes o requieren trabajo manual para consolidarlos, ese es el problema que hay que resolver antes de pensar en el modelo.
El flujo de abajo solo funciona si la primera etapa está bien resuelta.
3. ¿Puedes integrar la predicción donde se toma la decisión?
Esta parte es muy subestimada.
Un modelo que se desempeña bien pero no está conectado al sistema donde se actúa, no cambia nada. El valor no está en la predicción que genera el modelo. Está en la decisión que ese número permite tomar, en el momento en que hay que tomarla.
En el caso del ejemplo de scoring crediticio presentado arriba, el modelo tiene valor real cuando la probabilidad de incumplimiento llega al analista o al sistema de aprobación en el momento en que se evalúa la solicitud. No en un reporte que alguien revisa días después, cuando ya la exposición se materializó.
Si estos tres temas están bien estructurados, las condiciones están dadas para que un modelo predictivo genere impacto real.
Si hay dudas en alguno de estos componentes, ese es el punto de partida. Es el trabajo que hay que hacer primero para que las soluciones más avanzadas funcionen bien.



