Clasificación del consumo de alcohol en adolescentes según características conductuales, biológicas y ambientales: un enfoque de aprendizaje automático con control de sesgos

Ruobing Liu , et al. doi: https://doi.org/10.64898/2026.02.24.26347002

Recopilado por Carlos Cabrera Lozada. Individuo de Número, ANM Sillón VII. ORCID: 0000-0002-3133-5183. 03/03/2026

Resumen

En 2024, aproximadamente el 30% de los adolescentes estadounidenses reportaron haber consumido alcohol al menos una vez en su vida, y cerca del 25% de estos individuos consumieron alcohol en exceso. El consumo de alcohol en adolescentes se asocia con deterioro del neurodesarrollo, un mayor riesgo de consumo posterior y trastornos de salud mental. Estos hallazgos subrayan la importancia de identificar las variables que impulsan el consumo de alcohol en adolescentes y aprovecharlas para la identificación temprana y la intervención dirigida. Estudios previos han desarrollado modelos de clasificación de aprendizaje automático que utilizan datos de neuroimagen en combinación con mediciones clínicas limitadas. Los datos de neuroimagen son costosos y difíciles de obtener a gran escala, mientras que las mediciones clínicas son más prácticas para el cribado a gran escala debido a su bajo costo y amplia accesibilidad. Sin embargo, los enfoques exclusivamente clínicos para la clasificación del consumo de alcohol siguen siendo poco explorados. Además, estudios previos se han centrado a menudo en adultos, lo que limita la generalización a la población adolescente en general. Asimismo, factores de confusión como la edad y el consumo de sustancias, que están fuertemente correlacionados con el consumo de alcohol, a menudo se han abordado de forma inadecuada, lo que podría inflar el rendimiento de la clasificación. Finalmente, el desequilibrio de clases sociales sigue siendo un desafío persistente, y los intentos previos solo han producido mejoras limitadas. Para abordar estas limitaciones, proponemos FocalTab, un marco que integra TabPFN con pérdida focal para lograr una generalización robusta y una mitigación eficaz del desequilibrio de clases. El enfoque también incorpora un paso inicial de preprocesamiento para eliminar factores de confusión, como la edad y el consumo de sustancias. Comparamos FocalTab con métodos de vanguardia en diferentes selecciones de variables y configuraciones de conjuntos de datos. FocalTab alcanza la mayor precisión (84,3 %) y especificidad (80,0 %) en el entorno más riguroso, en el que se excluyeron las variables de edad y consumo de sustancias, mientras que los modelos de la competencia presentan una especificidad casi aleatoria (12-24 %). Además, aplicamos el análisis SHapley Additive exPlanations (SHAP) para identificar predictores clínicos clave de la clasificación de los bebedores, lo que facilita un mejor cribado y una intervención temprana.