Abstract:
Introducción: La anemia es un problema mundial de salud pública, que afecta especialmente a poblaciones vulnerables como niños, embarazadas y adultos mayores. En el Perú, la prevalencia de anemia en niños menores de 3 años ronda entre el 40% y 50%, con mayor porcentaje en zonas rurales, situación que ha persistido en el tiempo a pesar de los esfuerzos por reducirla. Objetivo del estudio: Se propone desarrollar un modelo predictivo basado en técnicas de Inteligencia Artificial o Machine Learning para estimar el porcentaje de anemia en comunidades peruanas, aprovechando datos abiertos de salud pública. Diseño del estudio: Se propone un estudio observacional retrospectivo de tipo longitudinal, utilizando datos secundarios recopilados por el Ministerio de Salud. Población y muestra: La población de estudio comprende las comunidades a nivel nacional (departamentos, provincias y distritos del Perú), sin enfocarse en un departamento específico. No se realizará muestreo, dado que se utilizarán todos los datos disponibles en las fuentes abiertas del MINSA sobre anemia. Procedimientos y técnicas: Se recopilarán y depurarán los registros de anemia y otras variables teóricamente relacionadas. Luego se entrenará un modelo de machine learning utilizando algoritmos supervisados (Random Forest) para predecir la prevalencia de anemia en cada comunidad en función de los determinantes de salud identificados. Análisis estadístico: Se evaluará el desempeño del modelo mediante métricas como la exactitud (accuracy), recuperación (recall), precisión (precision) y el área bajo la curva (AUC). Se espera que el modelo logre identificar patrones complejos entre los determinantes de la salud y la anemia.