Segmentación dinámica: por qué no se puede imputar a ciegas
25 de febrero de 2026 · 2 min de lectura
Data Imputation · Data Quality · Econometría · Kalman Filter · Statistical Modeling · TVECM · missing data · mlops · pipeline engineering · price transmission · reproducibilidad · rstats · segmentation · series de tiempo
El problema no era el modelo TVECM: eran los datos. Varias series mostraban ajustes imposibles porque hasta un 60 % de sus valores provenían de imputación Kalman aplicada a la serie completa. En este post explico por qué los filtros globales fallan y cómo un enfoque por mes calendario —detectando meses razonables, formando islas de continuidad, filtrando por densidad real y aplicando Kalman solo dentro de segmentos confiables— reduce la imputación promedio de ~35 % a ~15 % y evita estimar dinámicas económicas sobre señal sintética. Una lección práctica de ingeniería de series temporales: la imputación solo debe cerrar huecos cortos, nunca reemplazar la información.