Dar sentido a los datos

El uso de las ontologías en la medicina de precisión

La presente revisión describe las ontologías y su uso en el razonamiento computacional para respaldar la clasificación precisa de los pacientes para el diagnóstico, la administración de la asistencia y la investigación traslacional

Autor/a: Haendel M, Chute C, Robinson P

Fuente: New England Journal of Medicine 379(15):1452-1462, Nov 2018

Indice
1. Página 1
2. Página 2

Introducción

La clasificación de los pacientes permitiría a la medicina de precisión mejorar el diagnóstico y el tratamiento médico. La vasta cantidad de datos clínicos e información científica disponible permite crear estrategias de clasificación que relacionen la intervención con los mecanismos de la enfermedad en subgrupos de pacientes.

El uso de las ontologías (representaciones sistemáticas de conocimiento) para interpretar y analizar grandes cantidades de datos heterogéneos permitiría clasificar a un paciente de manera precisa.

En la presente revisión se describen las ontologías y su uso en el razonamiento computacional para respaldar la clasificación precisa de los pacientes para el diagnóstico, la administración de la asistencia y la investigación traslacional.

La abundancia de datos

Mediante los registros de salud electrónicos (RSE) se pueden recopilar observaciones subjetivas y objetivas relacionadas con las características demográficas, los hallazgos, los síntomas, los diagnósticos, las medicaciones, entre otros.

En la actualidad los resultados de los análisis genómicos, proteómicos y metabólicos son usados en los análisis clínicos. Además, los datos públicos pueden ser tomados como referencia para comparar los datos clínicos. La cantidad y la calidad de los datos acumulados no tienen precedentes en la historia humana.

Con frecuencia la información fenotípica sobre los pacientes individuales está incompleta o es inaccesible y esto impide la detección de similitudes y la clasificación de los pacientes dentro de grupos de utilidad clínica.

En ciertas enfermedades, esta detección y clasificación sería desafiante e importante, pero el objetivo principal de la medicina de precisión es entender cómo usar estos datos para estratificar a los pacientes y detectar similitudes entre las distintas enfermedades.

Dar sentido a los datos

Los métodos de inferencia necesitan categorizar a los sujetos de acuerdo con las covariables, las características o ambas. Es necesario crear clasificaciones útiles que conjuguen una plétora numérica o variables continuas, dicotomías, grupos ordinales y categorías taxonómicas.

Las clasificaciones nombran las entidades en cada dominio y aportan especificaciones computacionales de diferentes grados de sofisticación. Los mecanismos para nombrar y especificar sus relaciones a otro van de las simples terminologías a las ontologías.

Los estándares de los datos serían el primer paso en hacer que los datos sean computables y los pacientes sean clasificados de manera profunda. El integrar formatos y estructuras de fuentes diferentes para hacerlos compatibles es el desafío más grande.

Los estándares de los datos para la clasificación comparable y consistente

Los estándares de los datos pueden reducirse a la estructura y la semántica. La estructura sería la disposición de los datos, ya sea en una pantalla o un esquema de base de datos. La semántica hace referencia a los conceptos y las relaciones entre ellos.

Los sistemas de software requieren afirmaciones sobre la equivalencia de los términos, ya que el mapeo de datos clínicos a través de los sistemas o los datos de la ciencia básica se ve comprometido por las diferencias en los sistemas de nombres o la estructura.

La semántica y la estructura tienen una relación estrecha, el emparejamiento de las fuentes de información debe acomodar diferentes fundamentos semánticos y anticipar las modificaciones de la semántica de acuerdo con su contexto local. Poder alinear datos a través de los pacientes y los sistemas con formatos comparables y consistentes y significado contextual sería fundamental para la medicina de precisión.

De la terminología a la ontología

Las terminologías son utilizadas hace tiempo en la recuperación de información desde diversas fuentes. Estas fuentes, que comprometen nombres estandarizados y listas de sinónimos y referencias cruzadas, proporcionan la base para la búsqueda y la indexación y son de uso frecuente en los RSE y las bases de datos públicas.

Las ontologías definen las relaciones entre los conceptos, lo que permite el razonamiento lógico computacional.

Una ontología es un conjunto de conceptos y sus sinónimos, así como las definiciones de la descripción lógica que especifican las relaciones formales entre los conceptos.

El uso de lógicas de descripción en una ontología garantizaría la consistencia lógica lo que permite que los procedimientos de razonamiento computacional identifiquen hechos implicados pero no declarados de manera expresa en los datos originales.

Las ontologías permitirían aprovechar el conocimiento latente dentro de los grandes datos clínicos y podrían ser usadas en combinación con el procesamiento del lenguaje natural para desambiguar conceptos de los textos.

Además, las ontologías pueden apoyar la integración de los datos de la ciencia básica y el conocimiento público, lo que permitiría la clasificación de los pacientes sobre datos que van más allá de los RSE y aportaría perspectivas clínicas nuevas.

Las ontologías para la clasificación de las enfermedades

La clasificación de Linnaeus utilizada para desarrollar la ontología de las enfermedades sirvió como base para la primera edición de la International Classification of Diseases (ICD). Esta última continúa siendo considerada un estándar para la epidemiologia, el control de la salud y la facturación, pero no como una representación computacional del paciente como un sujeto biológico.

El problema más grande la ICD es que las ediciones históricas son clasificaciones estadísticas que son mutuamente excluyentes y exhaustivas.

En la ICD cada código tiene solo una causa y esto excluye el conteo múltiple y crea asociaciones arbitrarias. Las mono-jerarquías limitan ejes importantes de caracterización y la investigación, además de impedir los análisis significativos de la enfermedad y otros fenotipos.

La clasificación racional de las enfermedades asocia el fenotipo con las características de una persona que son atribuibles al genotipo y el término junto con los datos ómicos y los registros médicos es utilizado por los investigadores para definir un cohorte de pacientes con el mismo diagnóstico.

Según un estudio, computar los algoritmos del fenotipo a través de los centros médicos con sistemas diferentes de RSE sería útil. Sin embargo, los códigos utilizados en estos algoritmos son capturados con fines de facturación y no para el diagnóstico diferencial.

El SNOMED CT es un sistema composicional que puede ser usado en maneras diferentes dentro de sistemas y contextos diferentes y por diferentes usuarios y todavía dar el mismo significado conceptual y computacional, por lo tanto sería una ventaja sobre las terminologías. No obstante, menos de un cuarto del contenido del SNOMED CT está definido de forma lógica.

Las ontologías podrían organizar y analizar grandes cantidades de datos que serían difíciles de manejar por un médico además de mejorar la habilidad de este para clasificar los pacientes.

Las enfermedades raras y la ontología del fenotipo humano

La secuenciación de los exomas y los genes permitió descubrir numerosas enfermedades nuevas asociadas a los genes y, en algunos casos, este diagnóstico modifica el tratamiento clínico.

La importancia clínica completa de los análisis basados en variantes genéticas requiere información adicional de las enfermedades y las anormalidades fenotípicas.

El Human Phenotype Ontology(HPO) relaciona los perfiles fenotípicos computables de las enfermedades humanas y los pacientes individuales con los términos que están cerca uno del otro en la jerarquía y ponderados de acuerdo con la especificidad de las anormalidades fenotípicas individuales.

El HPO proporciona una representación más detallada de los fenotipos clínicos que otras terminologías clínicas u ontologías, y está diseñado para análisis computacional. Además este método representa al paciente como un sujeto biológico.

El uso del emparejamiento fenotípico basado en el HPO combinado con la secuenciación genética habría permitido la priorización de genes candidatos con las variantes patógenas predichas.

El futuro de las ontologías en la medicina

Un deseo es poder utilizar la gran cantidad de datos disponibles para poder clasificar a los pacientes e identificar los tratamientos eficaces y seguros.

En un foro propusieron una taxonomía nueva para la biología y la medicina estructurada para reconocer y aprovechar los ejes múltiples de la ciencia básica y las características clínicas como una matriz que defina los endotipos de las enfermedades. Debe logarse que la anotación de los datos con etiquetas ontológicas sea una tarea de fondo automatizada.

Las metas de la medicina individualizada encuentran ciertos obstáculos.

  • El primero y más desafiante es un conjunto de leyes de la privacidad, que tengan en cuenta la privacidad del paciente y la confidencialidad en un nuevo marco ético en el que se pueda compartir los datos clínicos para el beneficio de la sociedad.
     
  • El segundo obstáculo es el costo y el esfuerzo para ingresar y sacar datos de los RSE.
     
  • Por último, el tercer obstáculo es la falta de comparabilidad y consistencia entre los datos y fuentes de conocimiento, que lleva a la falta de interoperabilidad.

IIC- Sociedad Iberoamericana de Información Científica