Introducción: La vinculación laboral con el sector público o privado es una característica creciente en los ecosistemas científicos de países con recursos limitados. Sin embargo, se desconoce en qué medida ciertos indicadores académicos y profesionales predicen esta condición entre investigadores del área de Ciencias Médicas y de la Salud en Perú. Objetivo: Desarrollar y validar modelos de machine learning para predecir la vinculación laboral con el sector público o privado entre los investigadores RENACYT con filiación académica y del área de Ciencias Médicas y de la Salud. Métodos: Estudio observacional, transversal, basado en datos de 1,340 investigadores con filiación académica registrados en RENACYT entre 2021 y 2023. Se construyeron modelos predictivos (Gradient Boosting, Random Forest, XGBoost, entre otros) empleando variables profesionales, de producción académica y científica. Se seleccionó el modelo con mejor rendimiento. Resultados: El 66.9 % de los investigadores reportó vinculación con entidades del sector público o privado adicional a su filiación académica con la universidad. El modelo principal (Gradient Boosting) alcanzó una AUC de 0.85, exactitud de 0.87, sensibilidad de 0.91 y precisión de 0.90. La mayoría de los investigadores presentó bajo impacto bibliométrico (mediana índice H = 2), escasa participación en proyectos competitivos (mediana = 0) y limitada dirección de tesis. Las variables del modelo fueron publicaciones indexadas en Scopus, tesis dirigidas y participación en proyectos con financiamiento. Sin embargo, los valores SHAP mostraron efectos no unidireccionales. Conclusión: Los perfiles con vinculación académica y con el sector público o privado no se explican únicamente por la productividad científica, sino por la interacción multidimensional entre indicadores profesionales y académicos. El uso de modelos de machine learning y valores SHAP permitió identificar patrones latentes y aportar evidencia útil para la comprensión de trayectorias científicas en contextos con restricciones estructurales. Estos hallazgos pueden informar políticas públicas e institucionales orientadas a fortalecer sectores del ecosistema científico.
Introduction: Employment linkage with the public or private sector is an increasingly common feature in scientific ecosystems of resource-constrained countries. However, it remains unclear to what extent certain academic and professional indicators predict this condition among researchers in the field of Medical and Health Sciences in Peru, registered in the National Registry of Science and Technology (RENACYT). Objective: To develop and validate machine learning models to predict employment linkage with the public or private sector among RENACYT researchers affiliated with academic institutions in the field of Medical and Health Sciences. Methods: A cross-sectional observational study was conducted using data from 1,340 researchers with academic affiliation, registered in RENACYT between 2021 and 2023. Predictive models (Gradient Boosting, Random Forest, XGBoost, among others) were built using professional, academic, and scientific production variables, applying temporal censorship up to the event of interest. The model with the best performance was selected. Results: A total of 66.9% of researchers reported employment linkage with public or private sector entities in addition to their academic affiliation. The best-performing model (Gradient Boosting) achieved an AUC of 0.85, accuracy of 0.87, sensitivity of 0.91, and precision of 0.90. Most researchers exhibited low bibliometric impact (median H-index = 2), limited participation in competitive research projects (median = 0), and minimal thesis supervision. Key predictive variables included Scopus-indexed publications, thesis supervision, and participation in funded projects. However, SHAP values revealed non-unidirectional and complex effects. Conclusion: Employment linkage with public or private sectors among academic researchers is not solely determined by scientific productivity but results from a multidimensional interaction of academic and professional indicators. The use of machine learning models and SHAP values enabled the identification of latent patterns, offering valuable evidence for understanding research career trajectories in structurally constrained environments. These findings may support the design of public and institutional policies to strengthen the scientific ecosystem.