Con el auge de las redes sociales, la enorme cantidad de datos publicados por los usuarios ha generado esperanzas para la detección de usuarios con depresión.
por Yujie Wan, Zaiquan Dong, Meiwen Li, Baoxing Jiang, Jingjing Zhu, Shenggen Jua
Puntos clave
- Redefinimos la detección de la depresión y construimos un conjunto de datos para la detección del riesgo de depresión.
- Proponemos un modelo que tiene en cuenta los sentimientos y que fusiona conocimientos heterogéneos.
- Proponemos una tarea auxiliar para medir la gravedad del sentimiento negativo del usuario.
Abstracto
Con el auge de las redes sociales, la enorme cantidad de datos publicados por los usuarios ha generado esperanzas para la detección de usuarios con depresión. Sin embargo, los datos utilizados para la detección de la depresión provienen principalmente de usuarios con enfermedades crónicas y cuyas publicaciones están cargadas de un fuerte sentimiento negativo. Esto dificulta la detección de tendencias depresivas en el usuario general durante la evaluación inicial. Además, los métodos existentes se han centrado principalmente en modelar la información semántica de los textos, descuidando información clave como el conocimiento del sentimiento, el conocimiento del dominio de la depresión y la gravedad del sentimiento negativo.
En este trabajo, redefinimos la detección de la depresión como detección del riesgo de depresión y construimos un nuevo conjunto de datos relevante. Asimismo, proponemos un modelo sensible al sentimiento que fusiona conocimientos heterogéneos para la predicción del riesgo de depresión. El modelo fusiona de forma completa y eficaz el conocimiento del sentimiento con el conocimiento del dominio de la depresión mediante una estrategia de fusión de conocimiento multinivel para explorar en profundidad la representación implícita de los usuarios con depresión. Adicionalmente, proponemos una tarea auxiliar para percibir eficazmente la gravedad general del sentimiento negativo del usuario. Los resultados experimentales demuestran que el modelo alcanza un rendimiento de vanguardia en el conjunto de datos propuesto.
Introducción
La depresión, también conocida como trastorno depresivo, es una enfermedad mental común. Según un informe de la Organización Mundial de la Salud, actualmente hay más de 350 millones de personas que sufren depresión en todo el mundo (Organización Mundial de la Salud, et al., 2017). Desafortunadamente, menos de la mitad de las personas con depresión en el mundo reciben el tratamiento necesario (Olfson, Blanco y Marcus, 2016; Saxena, Thornicroft, Knapp y Whiteford, 2007). Además, las personas que sufren depresión a menudo adoptan una actitud de espera a la hora de buscar ayuda profesional debido a la falta de conciencia sobre su enfermedad o a un conflicto interno, lo que conlleva perder el momento óptimo para la intervención y el tratamiento (Edwards, Tinning, Brown, Boardman y Weinman, 2007).
En los últimos años, con el continuo desarrollo de las redes sociales, las personas se inclinan cada vez más a compartir su vida diaria en estas plataformas. Estas plataformas también ofrecen a los pacientes con depresión una forma catártica de expresar sus dolencias psicológicas y buscar apoyo emocional (Park, Cha, Cha, 2012; Reece, Reagan, Lix, Dodds, Danforth, Langer, 2017). Por lo tanto, el procesamiento automatizado de datos de redes sociales es crucial para la detección de pacientes con depresión, ya que permite un seguimiento oportuno de los cambios en su estado de salud mental antes de que los síntomas depresivos provoquen problemas de salud más graves (Qin et al., 2023a).
El continuo desarrollo de métodos de aprendizaje profundo ha impulsado su aplicación en la detección de la depresión en redes sociales, como las redes neuronales convolucionales (CNN), las redes neuronales recurrentes (RNN) y los modelos preentrenados (PLM). Sin embargo, estos trabajos aún presentan algunos desafíos:
- C1: Como se indica en la literatura (Zhang, Yang y Ananiadou, 2023b), la detección temprana de la depresión facilita la intervención y el tratamiento del paciente. Por lo tanto, la detección precoz de la depresión es crucial. Sin embargo, los métodos actuales de detección de la depresión solo la consideran una tarea de clasificación binaria, es decir, si un usuario está deprimido o no. Por otro lado, mediante la observación y el análisis de conjuntos de datos relevantes por parte de expertos médicos del grupo, se observó que la mayoría de los usuarios con depresión en el conjunto de datos presentaban depresión moderada o grave. Esto se debe a que su comportamiento coincide con los síntomas clínicos de la depresión moderada o grave. Por consiguiente, sus datos textuales contienen expresiones negativas claramente relacionadas con la depresión. Esto dificulta el uso de estos datos para detectar tendencias depresivas en la población general durante la detección precoz de la depresión. Además, resulta difícil satisfacer las necesidades reales de la vida cotidiana.
- C3: Si bien Zhang et al. (2023b) reconocieron la importancia de la información sobre el sentimiento, ignoraron la gravedad del sentimiento negativo, un factor crucial para identificar a los usuarios con tendencias depresivas. Esto se debe a que las personas con depresión tienden a experimentar un sentimiento negativo que progresa de leve a grave, o bien, a mantenerse en niveles moderados o graves. En cambio, los usuarios sin depresión experimentan un sentimiento negativo ocasional, lo cual constituye una fluctuación normal. Como se muestra en la Tabla 1, por ejemplo, el usuario 1, que padece depresión, pasó gradualmente de estar lleno de anticipación al principio a sentir dolor, mientras que el usuario 2, también con depresión, mantuvo un sentimiento negativo intenso en general. Por otro lado, el usuario 3 experimenta un sentimiento negativo leve de forma ocasional.
En este artículo, para abordar los desafíos mencionados, primero redefinimos la detección de la depresión como una tarea de detección del riesgo de depresión y construimos un conjunto de datos para la detección del riesgo de depresión (DR2D) en redes sociales. Este conjunto de datos combina las publicaciones históricas de los usuarios para detectar su nivel de riesgo de padecer depresión (C1). Para ello, reordenamos las publicaciones de los usuarios cronológicamente y conservamos todas las anteriores a la que identificó por primera vez al usuario como afectado por la depresión. Posteriormente, evaluamos el riesgo de depresión de todos los usuarios y los etiquetamos.
En segundo lugar, proponemos un modelo con reconocimiento de sentimientos que fusiona conocimiento heterogéneo (SM-HK) para la detección del riesgo de depresión. Específicamente, utilizamos de forma completa y eficaz el conocimiento de sentimientos y el conocimiento del dominio de la depresión mediante una estrategia de fusión de conocimiento multinivel (C2). A nivel de publicación, proponemos un método de ajuste fino del dominio con reconocimiento de sentimientos. Este método construye un corpus del dominio con conocimiento de sentimientos negativos mediante la combinación de un grafo de conocimiento de sentimientos para generar oraciones auxiliares con sentimiento negativo. Finalmente, se obtiene el modelo preentrenado con reconocimiento de sentimientos utilizando este corpus para el ajuste fino del dominio.
Lo utilizamos para capturar la representación de las publicaciones que incorpora información sobre el sentimiento negativo. A nivel de usuario, proponemos un método de fusión de conocimiento heterogéneo. Este método se basa en el conocimiento aumentado mediante un Modelo de Lenguaje Grande (LLM) y el análisis de síntomas depresivos. Construye un grafo heterogéneo de síntomas y publicaciones utilizando el orden temporal entre las publicaciones, la similitud semántica y los síntomas relacionados que coinciden con la descripción. Además, proponemos una tarea auxiliar denominada Detección de la Gravedad del Sentimiento Negativo del Usuario (UNSSD), estrechamente relacionada con la tarea principal. Esta tarea detecta la gravedad general del sentimiento negativo actual del usuario analizando la tendencia del sentimiento negativo en sus publicaciones anteriores.
Con esta tarea, el modelo puede percibir eficazmente la gravedad general del sentimiento negativo del usuario (C3). Los conjuntos de datos y modelos propuestos han sido aprobados y revisados por expertos médicos del grupo. Las principales contribuciones de este trabajo son las siguientes:
- Redefinimos la detección de la depresión como una tarea de detección del riesgo de depresión y construimos un conjunto de datos de detección del riesgo de depresión para evaluar el nivel de riesgo de un usuario de padecer depresión, abriendo una nueva dirección para futuras investigaciones.
- Proponemos un modelo sensible al sentimiento que fusiona conocimientos heterogéneos para la detección del riesgo de depresión, con el fin de utilizar de forma plena y eficaz el conocimiento del sentimiento y el conocimiento del dominio de la depresión.
- Proponemos una tarea auxiliar para detectar la gravedad del sentimiento negativo del usuario, lo que permitirá al modelo percibir de manera efectiva la gravedad de dicho sentimiento.
- Los resultados experimentales muestran que SM-HK logra un rendimiento de vanguardia y puede evaluar eficazmente el riesgo de los usuarios en la depresión 1 .
Detección de la depresión
En los últimos años, los métodos de aprendizaje profundo, gracias a su eficiencia y automatización, se han utilizado como la principal estructura de red en el campo de la detección de la depresión en un número creciente de trabajos. Los primeros trabajos se basaban principalmente en CNN para agregar información textual local (Kim, Lee, Park, Han, 2020; Trotzek, Koitka, Friedrich, 2018). Posteriormente, dado que las RNN pueden aprender información de secuencia contextual en el texto, muchos estudios comenzaron a combinar las RNN con mecanismos de atención para detectar la depresión (Amanat, 2018).
Definición de tarea
Dado un conjunto de publicaciones del usuario u que contiene n publicaciones, donde la longitud de la publicaciónes m . El objetivo de la detección del riesgo de depresión es determinar el nivel de riesgo de un usuario basado en el conjunto de publicaciones P del usuario u .
Construcción del conjunto de datos
En los conjuntos de datos existentes para la detección de la depresión, la mayoría de los usuarios deprimidos ya han progresado a una depresión moderada o grave. Esto hace que sus datos textuales con expresiones negativas estén obviamente relacionados con la depresión y, por lo tanto, sean difíciles de usar para detectarla.
Configuración del conjunto de datos y de los parámetros
Para evaluar el rendimiento de SM-HK en la detección del riesgo de depresión, realizamos experimentos con el conjunto de datos DR2D propuesto. La Tabla 2 muestra las estadísticas de estos conjuntos de datos. Además, utilizamos dos métricas, precisión y macro-F1, para evaluar el rendimiento de SM-HK y otros modelos de referencia.Para el texto de las publicaciones, utilizamos bert-chinese y bert-base-uncased como modelos de lenguaje preentrenados. Para DR2D-CN,yson 0,36 y 0,86,ysony, respectivamente. Para DR2D-EN,
Conclusión
En este artículo, redefinimos la detección de la depresión como detección del riesgo de depresión y construimos un conjunto de datos relevante en redes sociales. Para ello, proponemos un modelo sensible al sentimiento que fusiona conocimiento heterogéneo. Este modelo utiliza de forma completa y eficaz el conocimiento afectivo y el conocimiento del dominio de la depresión mediante una estrategia de fusión de conocimiento multinivel. A nivel de publicación, combina un grafo de conocimiento de sentimientos para construir un corpus del dominio con conocimiento de sentimientos negativos y obtiene representaciones de las publicaciones.
Limitaciones
Este trabajo presenta varias limitaciones. Por un lado, debido a la escasez de recursos y personal, nos resultó difícil aumentar el tamaño del conjunto de datos. En este sentido, en el futuro recurriremos al innovador modelo de «gran lenguaje + verificación por expertos» para generar datos de alta calidad. Por otro lado, debido a la escasez de datos, no podemos recopilar ni procesar datos de redes sociales en otros idiomas. Finalmente, debido a la escasez y falta de disponibilidad de información relacionada existente, no podemos ampliar el conjunto de datos.
Referencias
- J. Chen y otros.El conocimiento de sentido común y fiable mejoró la detección de la depresión basándose en una decisión tripartita. Sistemas expertos con aplicaciones(2025)
- H. Zhang y otros.Detección de la tendencia a la depresión con características multimodales Métodos y programas informáticos en biomedicina(2023)
- J. Zhang y otros.Detección del estado depresivo multinivel basada en el aprendizaje de indicaciones precisasLetras de reconocimiento de patrones(2024)
- Ai m. (2024). Tarjeta modelo Llama 3….
- Almares AMModelo bi-LSTM basado en atención para la clasificación de la depresión en árabes(2022)
- A. Amanat y otros.Aprendizaje profundo para la detección de la depresión a partir de datos textualesElectrónica(2022)
- E. Cambria y otros.Senticnet 6: Aplicación conjunta de IA simbólica y subsimbólica para el análisis de sentimientosActas de la 29ª conferencia internacional de la ACM sobre gestión de la información y el conocimiento(2020)
- Devlin J. (2018). BERT: Preentrenamiento de transformadores bidireccionales profundos para la comprensión del lenguaje. Informe técnico…
- R. Dror y otros.Guía del autoestopista para probar la significación estadística en el procesamiento del lenguaje naturalLa 56ª Reunión Anual de la Asociación de Lingüística Computacional(2018)
- S. Edwards y otros.Reticencia a buscar ayuda y percepción de la ansiedad y la depresión en el Reino Unido: Un estudio piloto con viñetas.Revista de Enfermedades Nerviosas y Mentales(2007)
- S. Ghosh y otros.Un marco multitarea para detectar depresión, sentimiento y emociones multietiqueta en notas de suicidio.Computación cognitiva(2022)
- X. Glorot y otros.Comprender la dificultad de entrenar redes neuronales profundas de propagación hacia adelanteActas de la decimotercera conferencia internacional sobre inteligencia artificial y estadística(2010)
- Guo D., Yang D., Zhang H., Song J., Zhang R., Xu R., Zhu Q., Ma S., Wang P., Bi X. y et al. (2025). Búsqueda profunda-r1:…
- JE Harrison y otros.CIE-11: una clasificación internacional de enfermedades para el siglo XXIInformática médica y toma de decisiones de BMC(2021)
- Hurst A., Lerer A., Goucher AP, Perelman A., Ramesh A., Clark A., Ostrow A., Welihinda A., Hayes A., Radford A., y otros…
- Ji S., Zhang T., Ansari L., Fu J., Tiwari P. y Cambria E. (2021). Mentalbert: lenguaje previamente entrenado disponible públicamente…
- Jiang AQ, Sablayrolles A., Roux A., Mensch A., Savary B., Bamford C., Chaplot DS, Casas DD, Hanna EB, Bressand…
Fuente: https://www.sciencedirect.com/science/article/abs/pii/S0957417425038096