Crónica enfermedad > Cáncer > artículos del cáncer > PLOS ONE: Contexto Sensible Modelado de droga contra el cáncer Sensitivity

PLOS ONE: Contexto Sensible Modelado de droga contra el cáncer Sensitivity


Extracto

reciente proyección de sensibilidad a los fármacos en grandes paneles de líneas celulares de cáncer proporciona un recurso valioso hacia el desarrollo de algoritmos que predicen la respuesta al fármaco. Desde más muestras proporcionan una mayor potencia estadística, más se acerca a la predicción de la piscina sensibilidad a los fármacos múltiples tipos de cáncer juntos sin distinción. Sin embargo, los resultados de cáncer de Pan puede ser engañoso debido a los efectos de confusión de los tejidos o subtipos de cáncer. Por otra parte, el análisis independiente para cada tipo de cáncer se ve obstaculizada por el tamaño pequeño de la muestra. Para equilibrar esta disyuntiva, presentamos CHER (contextuales La heterogeneidad de regresión Enabled), un algoritmo que construye modelos predictivos de sensibilidad a los fármacos mediante la selección de las características genómicas predictivas y decidir cuáles deben y no deben-ser compartidos a través de diferentes tipos de cáncer, los tejidos y las drogas . CHER proporciona significativamente modelos más precisos de sensibilidad a los fármacos que los modelos basados ​​en la red elástica-comparables. Por otra parte, Cher proporciona una mejor comprensión de los procesos biológicos subyacentes mediante la búsqueda de un conjunto disperso de las características genómicas específicas del tipo compartidas y

Visto:. Chen BJ, Litvin O, L Ungar, Pe'er D (2015) Contexto Modelado sensible de la droga contra el cáncer de sensibilidad. PLoS ONE 10 (8): e0133850. doi: 10.1371 /journal.pone.0133850

Editor: Julio Vera, Universidad de Erlangen-Nuremberg, Alemania |
Recibido: 4 Febrero 2015; Aceptado: 3 Julio 2015; Publicado: 14 Agosto 2015

Derechos de Autor © 2015 Chen et al. Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons Attribution License, que permite el uso ilimitado, distribución y reproducción en cualquier medio, siempre que el autor original y la fuente se acreditan

Disponibilidad de datos: Los datos proceden de la Enciclopedia proyecto de la Línea celular del cáncer (http://www.broadinstitute.org/ccle/home) y están disponibles después de registro del usuario en el sitio web

Financiación:. Esta investigación fue apoyada por Unidos Contra el cáncer Innovative Research Grant (IRG08), Institutos nacionales de Salud (R01CA164729) y los Centros nacionales de Informática Biomédica subvención 1U54CA121852-01A1. D. P. y tiene una beca Packard para la Ciencia e Ingeniería

Conflicto de intereses:.. Los autores han declarado que no existen intereses en competencia

Introducción

Con los recientes avances en la secuenciación de próxima generación tecnologías, las perspectivas de la medicina personalizada se ven más brillantes que nunca [1]. El uso de la genómica para guiar la atención clínica es tal vez más extendida en el cáncer [2, 3]. Muchos estudios pioneros han demostrado cómo se puede utilizar firmas de expresión génica para predecir los resultados clínicos para los pacientes individuales [4-6]. Más recientemente dos grandes colecciones de las pantallas de drogas emparejados y perfiles genómicos de líneas celulares de cáncer se han publicado [7, 8]. Estos datos han sido utilizados para construir modelos de predicción de la respuesta a los fármacos mediante la asociación de características genómicas con sensibilidad a los fármacos en líneas celulares de cáncer [9-12]. Además, la conexión de sensibilidad a los fármacos a las características específicas del genoma puede ayudar a arrojar luz sobre los mecanismos de acción de los fármacos y dilucidar las razones subyacentes para la resistencia al tratamiento. Por lo tanto, estos datos ofrecen la oportunidad de desarrollar métodos que se pueden utilizar para el tratamiento personalizado.

Un desafío clave en asociar características genéticas de sensibilidad a los fármacos es el papel del contexto en los sistemas biológicos. Por ejemplo, la regulación de la expresión de genes se ha demostrado que tienen patrones específicos a los tejidos y tipos de células [13-16]. En la tumorigénesis, diversos patrones de mutación, expresión génica, y la regulación epigenética también se han observado en el cáncer específico o específico de tejido de manera [17, 18]. Esta dependencia del contexto juega un papel importante en la eficacia del tratamiento. Por ejemplo, PLX4732, un inhibidor de la RAF focalización oncogénico
BRAF


V600E
, es un potente tratamiento para los pacientes con melanoma con la mutación [19]. Sin embargo, los pacientes de cáncer de colon con la misma mutación no responden a PLX4732 [20]. Por tanto, es importante tener en cuenta el contexto creado por los tipos de cáncer en el análisis de la genómica de sensibilidad a los fármacos.

No es de extrañar que los modelos predictivos construidos usando sólo datos de melanoma dan una mejor predicción de muestras de melanoma que las construidas utilizando datos de tipos de cáncer mixtos [7]. Este sostiene que debemos centrarnos en un tipo de cáncer en la construcción de modelos de sensibilidad a los fármacos. Aunque tal estrategia nos permite evitar la influencia de confusión de contexto, nos obliga a un pequeño número de muestras. Debido al tamaño de la muestra, los conjuntos de datos actuales carecen de la potencia estadística para construir modelos separados para cada cáncer.

Utilizamos elementos comunes entre los tipos de cáncer y medicamentos para superar la escasez de datos. Proponemos CHER (contextuales La heterogeneidad de regresión Enabled), un algoritmo que construye modelos predictivos mediante la selección de las características genómicas y decidir cuáles son compartidos o no entre el cáncer de tipos, los tejidos y las drogas. CHER está facultado por dos supuestos. En primer lugar, Cher asume tipos de cáncer similares pueden tener mecanismos similares sensibilidad a los fármacos subyacente. Por ejemplo, cáncer de mama de tipo basal y compartir el cáncer de ovario muchas firmas moleculares [21]; Por lo tanto, estos dos tipos de cáncer es probable que comparten características genómicas predictivos similares para la sensibilidad de drogas. En segundo lugar, Cher supone que si dos fármacos inducen respuestas similares, sus modelos predictivos son probablemente similares. Estos supuestos permiten CHER a aumentar su potencia para descubrir biomarcadores predictivos de sensibilidad a los fármacos mediante el intercambio de información entre el cáncer y las drogas.

Se aplicaron CHER a tres conjuntos de datos a partir de la línea celular de cáncer Enciclopedia (CCLE) [7] y demostrar que CHER da significativamente modelado más precisa de la sensibilidad a los fármacos en estos conjuntos de datos en comparación con otros métodos. Al contrario de los métodos anteriores que asumir todas las muestras tienen las mismas características predictivas, Cher aprende explícitamente qué características predictivas deben ser compartidos o no entre los cánceres o subtipos. Para los datos con múltiples subtipos de muestras, Cher también identifica el subtipo relevante que determina la especificidad de contexto, que ofrece el potencial de arrojar luz sobre los mecanismos que subyacen a la farmacogenómica.

A continuación presentamos en primer lugar la motivación y el concepto de Cher, seguido por los resultados de la aplicación a los datos CCLE. A continuación, comparar el rendimiento de Cher con otros métodos y demostrar un rendimiento superior de Cher. modelos de ejemplo de Cher se exhiben y discutidos. Los detalles sobre CHER algoritmo se presentan luego en Materiales y Métodos y S1 texto.

Resultados

La heterogeneidad contextual Activado regresión

Hemos utilizado los datos de línea celular de cáncer Enciclopedia (CCLE) [ ,,,0],7] para nuestro análisis. La cohorte CCLE incluye 36 tipos diferentes de cáncer que normalmente se agruparon para el análisis sin distinción entre los tipos [7]. Sin embargo, los efectos de tejido sobre la sensibilidad a las drogas son evidentes (Figura S1).

Una forma de abordar este problema es volver a cabo el efecto medio de los tejidos a través del análisis multivariado de varianza (MANOVA) y luego modelar los residuos de todas las muestras junto [8]. Sin embargo, esto no se ocupa del efecto contextual. Es decir, el efecto de las interacciones de genes de tejidos. Por ejemplo,
MDM2
sobreexpresión es conocido por ser predictivo de la sensibilidad a la Nutlin-3 en la leucemia mieloide aguda [22] y la leucemia linfoblástica aguda [23]. Sin embargo, la correlación entre el
MDM2
expresión y sensibilidad a Nutlin-3 varía mucho entre los tejidos (de Pearson coeficiente de correlación r: -0.01 -0.53 ~). S2B Fig muestra la asociación entre
MDM2
expresión y sensibilidad a la Nutlin-3 en diferentes tejidos. Aunque esta asociación puede detectarse utilizando todas las muestras (r = -0,38; p & lt; 5e-8), dicha asociación es engañosa, ya que
MDM2
expresión no tiene ningún poder predictivo de los tejidos, tales como pulmón o páncreas (S2B figura). Por otra parte, si descartamos las muestras de los tejidos donde la asociación está ausente, podemos ver una mayor asociación (Fig S2A) y un aumento de

poder predictivo de MDM2 en estos tejidos. Como cada tejido puede tener diferentes grados de asociación entre
MDM2
expresión y sensibilidad a la Nutlin-3, tales efectos de genes específicos de tejido se convertirá en
efectos de interacción de genes tejido
cuando todas las muestras se agruparon para el análisis. El uso de MANOVA simplemente una regresión a cabo el efecto promedio de cada tejido no resolverá tal efecto génica específica de tejido.

Lo ideal sería limitar el análisis a un tipo de cáncer a la vez, pero por desgracia el tamaño de la muestra resultante es actualmente demasiado pequeña. Los datos de sensibilidad de drogas disponibles en CLLE incluye menos de 40 muestras para la mayoría de tipos de cáncer, excepto cáncer de pulmón (n = 91), los cánceres se originaron a partir de tejidos hematopoyéticos y linfoides (n = 70), y cáncer de piel (n = 40) (S3 Fig) e incluso estos tamaños de las muestras son relativamente pequeñas. La falta de poder estadístico debido al pequeño tamaño de la muestra se agrava aún más por el tamaño y la complejidad del genoma humano.

Para alcanzar el poder estadístico y siguen representando la especificidad del contexto desarrollamos
Cher gratis (contextuales la heterogeneidad de regresión Enabled), un algoritmo basado en la transferencia de aprendizaje [24] que selecciona las características genómicas predictivos y construye modelos de regresión para la sensibilidad de drogas. A diferencia de otros algoritmos, Cher tiene como objetivo descubrir características de predicción que se comparten a través de contextos, así como características que son predictivos sólo en ciertos contextos. Un contexto puede ser un tipo de cáncer, el tipo de tejido, o subtipo de cáncer. Nos referimos a este contexto que el
subtipo relevante
, o el

dividida, que separa a los individuos en dos grupos en los que el programa de predicción de la sensibilidad a los fármacos puede ser diferente.

Cher al mismo tiempo se consiguen dos objetivos: CHER realiza de forma explícita la función de selección escaso tiempo que optimiza el rendimiento de la predicción de la sensibilidad a los fármacos. Mientras que la optimización de la predicción de la predicción de sensibilidad a los fármacos es crucial para la medicina de precisión, la selección de características escasa permite la interpretación biológica de los modelos resultantes. Esto último es especialmente importante, ya que puede proporcionar una comprensión de resistencia a los medicamentos que podrían arrojar luz sobre la manera de mejorar el desarrollo de medicamentos o terapia combinatoria
.
Nuestro algoritmo se inspira en la teoría del aprendizaje de transferencia [24]. Aumentamos el poder mediante el intercambio de información entre los tipos de cáncer y entre las drogas. En primer lugar, nos enteramos de modelos a partir de los cánceres similares, compartiendo esencialmente la información entre los cánceres asumiendo que puedan compartir las mismas características genómicas responsables de la sensibilidad a los fármacos (figura 1A). Mediante la combinación de muestras de cánceres similares, aumentamos el poder de aprender predictores comunes a ellos. Para conocer predictores específicos de cada contexto específico, o de tipo de cáncer, se introduce un
dividida
variable que representa los tipos /subtipos de cánceres. Esta división condiciones variables los efectos predictivos de características específicas del contexto a través de los términos de interacción entre la variable de segmentación y los predictores en el modelo (por ejemplo, el gen A y M mutación en el melanoma, la figura 1A). Tenga en cuenta, la elección de la división es parte del problema de optimización. CHER aprende cómo separar las muestras en dos grupos, cuando dicha separación de muestras aumenta el poder predictivo. En esta etapa, Cher ha aprendido un modelo inicial que puede contener ambos predictores que son compartidos entre los cánceres o específica a uno de ellos.

A. Ejemplo de un modelo aprendido de Cher, donde la sensibilidad al fármaco de las muestras de melanoma se puede predecir por la mutación de M y la expresión génica de A y S, mientras que en glioma, la expresión del gen S y B son los predictores. Cher se aprovecha de las muestras de puesta en común de obtener el poder estadístico, identificando tanto compartida (gen S) y las características específicas del contexto (A, B y M). En los casos en que el contexto pertinente es desconocida, el algoritmo de búsqueda para el mejor "split", en su caso, a muestras separadas en dos grupos. Yi representa la sensibilidad al fármaco de la muestra i, xi son las características correspondientes de la muestra i, zit = 1 presenta la muestra i-ésima es el melanoma, y ​​yo (.) Es una función indicadora. B. esquema de Cher aprendizaje iterativo. CHER aprende inicialmente modelos con uniforme antes (es decir, cada característica genómica tiene la misma probabilidad de ser incluidos en el modelo). Durante cada iteración, Cher capacita a los modelos de regresión con bootstrapping, que permite que el algoritmo para establecer la frecuencia de cada función que se ha seleccionado. Entonces CHER ajusta los priores de acuerdo con la distribución de la frecuencia y la similitud entre fenotipos.

A continuación, aumentamos el aprendizaje de Cher mediante la transferencia de información entre fármacos (figura 1B). Suponemos que si dos fármacos inducen una respuesta similar, sus modelos predictivos son probablemente similares también. Por ejemplo, si dos fármacos inducen respuestas altamente correlacionados y hemos observado gen
Un
como predictor de la sensibilidad a un medicamento, también es más probable gen
Un
también es predictivo para la otra droga . Esto nos permite ajustar nuestra creencia de cada característica de ser predictivos de la sensibilidad a los fármacos mediante la comparación de modelos derivados de medicamentos similares. Desde el punto de vista bayesiano, los modelos iniciales de sensibilidad a los fármacos se aprenden suponiendo que cada función tiene la misma probabilidad de ser seleccionado (uniforme antes), y la posterior puesta en común de modelos entre las drogas, nos permite conocer una selección de características antes de cada fármaco. Este intercambio interactivo entre las drogas es fundamental para la capacidad de aprendizaje de Cher.

Durante cada iteración utilizamos L0-norma regularizado de regresión para seleccionar las características de predicción de sensibilidad a cada fármaco. En la regresión L0-norma regularizado, se aplica una penalización proporcional al número de características adicionales al modelo, como en los métodos de regresión por pasos clásicos, pero las características añadidas a la modelo no se contrae como en lazo [25] o elástico-net [26]. regularización L0-norma tiene varias ventajas. En primer lugar, el término de regularización en la regresión no paramétrica es, ya que la escasa selección de predictores en regularización L0-norma es guiado por la descripción de longitud mínima (MDL), donde la selección de cada característica se codifica como un
costo
o pena que asegura escasez del modelo (Materiales y Métodos). En segundo lugar, la correspondencia entre MDL y la estadística bayesiana nos permite ajustar de forma iterativa nuestra creencia estableciendo el costo de cada función de acuerdo a la probabilidad de que la característica de ser seleccionado. En cada iteración, utilizamos la regresión regularizado L0-norma con programa previo para construir una distribución de probabilidad (previo) para cada característica en función del número de veces que fue seleccionado. Esta distribución previa se ajusta aún más mediante el intercambio de información entre las drogas, la construcción de una pena para la selección de funciones en la siguiente iteración (Figura 1B). En tercer lugar, se utiliza un algoritmo voraz para construir eficazmente un L0-norma de regresión normalizado; los modelos resultantes de esta búsqueda se han demostrado tener un excelente rendimiento [27]. La consideración de los predictores contextuales requiere que el espacio de búsqueda incluye la interacción entre las características genómicas y contextos. Aunque tal característica del espacio grande puede plantear problemas para muchos algoritmos, los codiciosos-cher búsqueda permite buscar de manera eficiente los predictores relevantes en este gran espacio de características.

Para evaluar el desempeño de Cher, lo probamos en un conjunto de datos que es sintética simulado a partir de los datos reales (S1 texto). Comparamos Cher para el algoritmo de red elástica utilizada anteriormente para estos datos y evaluamos tres métricas: precisión, recordar y F-medida (S1 texto, figura 2). F-medida puntuaciones de la media armónica de precisión y la recuperación y representa el rendimiento general de los dos algoritmos. CHER intercambia algunos de recordatorio para producir una precisión más alta en comparación con la red elástica. En aplicaciones biológicas precisión se prefiere a menudo recordar, ya minimizar los falsos positivos ahorra futuras validaciones experimentales costosos. Por lo tanto, la precisión y la F-medida puntuaciones en las iteraciones finales sugieren la superioridad general de Cher en la identificación de predictores correctos (S1 texto y S4-S6 higos).

Bootstrapped red elástica (ES) se compara con CHER bootstrap. Un umbral de 0,3 y 0,5 se aplican a la frecuencia correspondiente (
τ
) para determinar características robustas en Cher y elástica, respectivamente. La precisión, recordar, F-medida de cada fenotipo de EN (eje x) se representa en función de que Cher (eje y). La primera fila muestra los resultados de Cher desde la primera iteración y la segunda fila los resultados de Cher de la 10
th iteración. Cada punto representa un fenotipo, coloreado por el nivel de ruido añadido.

Aplicación de Cher a conjuntos de datos CCLE

Cher se aprovecha de las muestras de la puesta en común de los cánceres similares para aumentar la potencia. Hemos construido conjuntos de datos de prueba basados ​​en el conocimiento previo de similitud cáncer y el número de muestras disponibles a partir de cada tipo de cáncer (S3 Fig), que en gran parte limitada a nuestra selección. Se agruparon las líneas celulares de cáncer linfoides (n = 70, CCLE-Sangre) basadas en el origen sangre y el tejido. Se agruparon mama (n = 27) y de ovario muestras de cáncer (n = 25) (CCLE-BreastOvary) debido a las similitudes genómicas entre los cánceres de mama de tipo basal y cánceres ováricos serosos de alto grado [28]. Por último, entre todos los datos disponibles CCLE, se agruparon juntos más melanoma (n = 38) y glioma (n = 25) (CCLE-SkinGlioma) porque melanocitos y neuroglia son ambos embriológicamente derivan del ectodermo. antígenos compartidos asociados a tumores [29] y las vías desreguladas [30] han sido reportados en el melanoma y glioma. Además, se observó una alta similitud entre las muestras de los tejidos del sistema y de la piel nervioso central, como se muestra en la proyección de las muestras en los componentes principales derivadas de los perfiles de expresión de genes (Fig S7). Por lo tanto, es posible que estos dos tipos de cáncer comparten algunas vías biológicas o características genómicas que contribuyen a la sensibilidad a los fármacos.

Cada conjunto de datos incluye un número diferente de posibles variables de segmentación para especificar posibles influencias contextuales. En CCLE-SkinGlioma, sólo se permite una división posible: si una muestra es el glioma o no. En CCLE-BreastOvary, se consideran dos divisiones posibles: podemos separar las muestras de tejido de origen (frente ovario de mama) o patología (cáncer de mama luminal frente de mama de tipo basal y de ovario). Finalmente, siete divisiones potenciales se consideran en el subconjunto CLLE-Blood, que representa los tipos de cáncer de diferentes orígenes de linaje (S1 tabla). Dos métricas se utilizan para representar la sensibilidad a cada fármaco: la concentración que inhibe el 50% de la proliferación (IC50) y el área de actividad por encima de la curva ajustada de los datos de respuesta a los fármacos (ACT). Los objetivos de Cher son: (1) identificar la mejor división, en su caso, (2) seleccionar las características genómicas predictivas que son comunes o contexto específico (definido por la división elegida) para cada fenotipo de sensibilidad a los fármacos, y (3) aprender el modelo de regresión para predecir la sensibilidad a los fármacos.

Debido al tamaño pequeño de la muestra, que limitan aún más las posibles características para reducir el espacio de búsqueda y por lo tanto aumentar la potencia. Hemos compilado listas de genes asociados con cada cáncer de la literatura y la base de datos de la enfermedad [31]. Sólo mutación, número de copias y la expresión génica de los genes asociados con los cánceres analizados se incluyen como posibles predictores. S2 tabla resume el número de fenotipos, características y muestras disponibles en cada conjunto de datos.

Evaluamos el rendimiento de Cher en los conjuntos de datos CCLE con una cantidad diez veces la validación cruzada (Materiales y Métodos). Pearson y Spearman coeficientes de correlación se utilizan para evaluar el desempeño. El algoritmo de red elástica [26] también se aplica a los subconjuntos CCLE para la comparación, ya que se ha utilizado con éxito para identificar características genómicas para la sensibilidad de drogas en [7, 8, 32]. regresión red elástica permite la selección de características genómicas predictivos basados ​​en L1 y L2-normas; el último es adecuado para las características de expresión de genes altamente correlacionados [32]. Sin embargo, el algoritmo de red elástica naïve no permite predictores contextuales, y por lo tanto, cada característica genómica seleccionado se utiliza para predecir la sensibilidad al fármaco de cada muestra, independientemente del contexto. La aplicación de red elástica aquí es la misma que la configuración en [7], donde no se consideraron características contextuales. Para complementar la falta de modelización contextual en la red elástica, las variables de segmentación utilizados en Cher también se incluyen como características binarios en la piscina función de red elástica.

La figura 3 compara el rendimiento de Cher y la red elástica (Materiales y Métodos). Como se muestra en la figura 3A, los modelos de red elásticas superan a los de la primera iteración de Cher. Sin embargo, después de diez repeticiones de intercambio entre los modelos (Figura 3B), Cher muestra una mejora significativa sobre la red elástica. Esto es porque el uniforme utilizado antes en la primera iteración falla para producir modelos para muchos fenotipos. Sin embargo, el rendimiento se mejora a través de iteraciones adicionales, ya que la información se intercambia entre los modelos de fenotipos similares y los priores de características se ajustan. El efecto de la transferencia de aprendizaje ya se puede observar en la segunda iteración (S8 y S9 figuras), lo que demuestra la utilidad de la transferencia de aprendizaje entre drogas de respuestas similares, como fármacos que comparten objetivos similares a menudo inducen sensibilidad similar (Fig S10).

coeficientes de correlación de Pearson entre el los verdaderos datos de sensibilidad y la predicción se calculan para cada algoritmo y trazan unos contra otros (eje x: red elástica, eje y: Cher). Cada punto representa un fenotipo. A. Las predicciones para muestras de melanoma y glioma a partir de la iteración inicial del algoritmo CHER se comparan con los de red elástica. B. Las predicciones para muestras de melanoma y glioma de CHER después de diez iteraciones se comparan con los de red elástica. C, D. Del mismo modo, pero de mama y de muestras de cáncer de ovario. E., F. Del mismo modo, pero para las muestras de sangre.

Al final del proceso de aprendizaje iterativo, Cher da un mejor rendimiento predictivo (Pearson coeficientes de correlación, ver Materiales y Métodos) que elástico-red para 60% (70/116) de los fenotipos de sensibilidad de drogas en los tres conjuntos de datos (p & lt; 6E-6, una prueba t de cola asociado, para la comparación de correlación de Pearson; p & lt; 2e-7 para comparar correlación de Spearman; Fig 3, S8 y S9 figuras). Por otra parte, para estos fenotipos 70, la mejora de la predicción de CHER sobre la red elástica es grande, con una mejoría media de 0,24 en la correlación de Pearson (S11 figura). Red elástica supera a Cher en sólo 46 fenotipos con una mejoría media de 0,12.

Comparación de las características seleccionadas por Cher y la Red elástica-net
Para profundizar en los modelos CHER produce, se comparan las características seleccionada por Cher y red elástica. Ambos algoritmos se aplican a todas las muestras en cada conjunto de datos con el programa previo. Únicas características que se eligen con firmeza a través de arranque son retenidos en el modelo final (Materiales y Métodos). Tenga en cuenta que hay muchos fenotipos para los que la red elástica no selecciona ninguna característica porque no hay características se eligen "con la frecuencia suficiente" entre las carreras de rutina de carga, lo que indica una falta de robustez en la selección de características de red elástica. Por ejemplo, elástico-net no selecciona a las características robustas para la mayoría de los fenotipos (35 de 39) para CCLE-BreastOvary, mientras que Cher sólo fracasa en un fenotipo. Por lo tanto, CCLE-BreastOvary se redujo de comparación. Para los otros dos conjuntos de datos, las comparaciones se hacen para un fenotipo sólo cuando el elástico-net también ha seleccionado siguientes características robustas de arranque.

En primer lugar, se compara el número de características elegidas por cada algoritmo (figura 4A). En comparación con Cher, elástico-net escoge con frecuencia muchas más características, probablemente debido a la regularización L2-norma de la red elástica, lo que favorece la selección de rasgos correlacionados. Comparamos las características superpuestas y únicas entre los dos algoritmos separándolos en cinco categorías: (1) características que son seleccionados por ambos algoritmos (
superposición pero cher-
compartidos en la figura 4A), (2) las características que son seleccionados por tanto, pero sólo son predictivos para un subtipo de muestras en Cher (
superposición pero Cher-contextual
), (3) las características que sólo son seleccionados por Cher y son predictivos para todas las muestras (
Cher
-sólo compartida), (4) características que sólo son seleccionados por Cher y son predictivos sólo para un subtipo de muestras (
Cher-solamente (5) características contextuales
) y que son sólo determinada por el red elástica (
ES-
solamente).

A. Número de entidades seleccionadas por ambos algoritmos e individuales para cada fenotipo. Para cada fenotipo (eje x), el número de características seleccionadas por CHER están representados en el eje y positivo, mientras que los seleccionados por red elástica están representados en el eje y negativo. Las funciones se dividen en cinco grupos, que corresponden a las funciones seleccionadas por ambos algoritmos o mediante algoritmos específicos para individuales. Fenotipo 1-14 son de CCLE-SkinGlioma y el resto son de CCLE-Sangre. B. Ajustado R
2 de Cher y modelos de red elástica utilizando las funciones seleccionadas por ambos algoritmos (características de las dos primeras categorías en a). C. Como B, pero todas las funciones seleccionadas por cada algoritmo se utilizan. Fenotipos en las tres figuras están ordenados por la diferencia de R
2 entre Cher y red elástica de C.

A partir de esta descomposición, nos encontramos con que 40/45 fenotipos tienen al menos una característica que se selecciona por tanto Cher y red elástica. Usando sólo estas características, se estima la varianza explicada (ajustado R
2) por Cher y red elástica (Figura 4B). Para CCLE-SkinGlioma (fenotipo 1-14 en la figura 4B), ajustado R
2 de son similares entre Cher y red elástica. Esto se debe a que sólo hay dos subtipos de muestras en los datos, y puede ser codificada como una característica binaria en la red elástica. Sin embargo, cuando los subtipos de muestras se vuelven más complicados como en CCLE-Sangre, el mérito de los modelos de Cher se manifiesta en la ganancia de R
2 (Fenotipo 15-45 en la figura 4B). Incluso con el mismo conjunto de características seleccionadas (categorías 1 y 2), Cher explica más varianza de red elástica durante 12 fenotipos de considerar los efectos contextuales de las características.

Al considerar todas las características seleccionadas por cada algoritmo, ver CHER logra un mejor ajustado R
2 de red elástica de 29/45 fenotipos (P & lt; 0,007, de una cola emparejado t-test, la figura 4C), a pesar de que los modelos de Cher a menudo contienen menos funciones que la red elástica. ganancias de Cher en I
2 también es más significativa que la de red elástica: ganancias CHER & gt; 0,2 R
2 sobre la red elástica para 11/29 fenotipos, mientras que las ganancias netas elásticas & gt; 0,2 R
2 más Cher 2/14 fenotipos. En conjunto, los resultados sugieren modelos finales de CHER explican una mayor variación en los datos, es probable logrado a través de la modelización de contexto.

Comparación con otros métodos

Además de la red elástica, que también comparó la el rendimiento de Cher con el Criterio de inclusión múltiple (
MIC
) [27], multi-tarea de lazo (
MTLASSO
) [33], la red elástica con todas las características de interacción gen-contexto (

ES-INT), y multi-tarea de regresión multi-núcleo bayesiano (
BMKL
), que recientemente ganó el NCI-SUEÑO predicción de sensibilidad a los fármacos desafío [34]. MIC es un algoritmo que selecciona características a través de la L0-norma y ha demostrado buenos resultados en las tareas de selección de características y de predicción. Es el predecesor de Cher, que se extiende CHER MIC mediante la adición de aprendizaje y transferencia de contexto (Materiales y Métodos). MTLASSO es una extensión del lazo que impone la restricción de escasez en todas las tareas de aprendizaje a la vez. En esencia, comparte características entre todos los fenotipos. En contraste BMKL es un método que primero utiliza múltiples núcleos para cada tipo de datos (por ejemplo, la mutación o expresión de genes) para resumir similitud entre las muestras, y luego usa la inferencia bayesiana para aprender pesos de regresión en ellos para predecir la sensibilidad a fármacos [34]. Una ventaja de BMKL es que los modelos de regresión puede ser no lineal a través de los cálculos del núcleo. Por último, añadimos todos los términos de interacción de tipo de cáncer y de genes (características contextuales) en el espacio de características y aplicamos la red elástica con interacciones (ES-INT). Es decir, incluimos en las piscinas cuentan con las variables binarias que especifican los tipos de cáncer y las características específicas del tipo de cáncer (por ejemplo. Los productos de variables binarias y características genómicas) para ES-INT. Tenga en cuenta todas las variables de segmentación utilizados en Cher también se incluyen como características binarios en función de la piscina para todos los métodos.

Se aplican todos los métodos a los conjuntos de datos CCLE y comparar su rendimiento en un diez veces la validación cruzada (Materiales y Métodos). Fig 5 y S12 Fig muestran el rendimiento global de cada método. En los tres conjuntos de datos, Cher supera a la mayoría de los métodos y realiza comparativamente con BMKL. Específicamente, Cher supera ES (p & lt; 6E-6, una cola de prueba t pareada, para la comparación de correlación de Pearson; p & lt; 2e-7 para comparar Spearman), MTLASSO (p & lt; 6E-5 para Pearson, p & lt; 2e-8 para Spearman), eN-INT (p & lt; 1e-3 para Pearson, p & lt; 3E-7 para Spearman) y MIC (p & lt; 3e-19 para Pearson, p & lt; 3e-24 para Spearman). CHER supera BMKL en CCLE-SkinGlioma (p & lt; 0,05 para Pearson, p & lt; 4e-3 de Spearman)., Tiene un rendimiento similar al BMKL en CCLE-BreastOvary, pero BMKL comporta mejor que Cher en CCLE-Blood

Pearson coeficientes de correlación entre el los datos de sensibilidad de predicción y se calculan para cada algoritmo. Los coeficientes de correlación de cada algoritmo (eje x) se compararon con los de Cher (eje y). Cada punto representa la predicción de rendimiento por una sensibilidad a los fármacos. Método abreviatura: ES, la red elástica, MIC, criterio de inclusión múltiple; BMKL: bayesiano multi-tarea multi-núcleo de regresión; MTLASSO: multi-tarea de lazo; ES-INT: ES con las interacciones genes-contexto. P-valores muestran la importancia de la predicción de Cher en comparación con otros métodos (una cola t-test).

Estas comparaciones ponen de relieve las ventajas de Cher. En primer lugar, Cher supera ES-INT si bien se ponen a disposición de todas las características contextuales a la red elástica. Esto muestra la selección de características superiores de Cher, es probable que se benefician de la transferencia de información entre múltiples fenotipos. En segundo lugar, las características contextuales son importantes como CHER supera MIC a pesar de Cher y MIC utiliza la misma metodología para la selección de características
.
A pesar del comportamiento similar entre Cher y BMKL, Cher también proporciona interpretabilidad de la relación entre las características genómicas y drogas sensibilidad. En los tres conjuntos de datos, Cher identifica muchas características predictivas que son o blancos directos de las drogas o en vías similares, lo que sugiere la relación entre estas características y sensibilidad a los fármacos. Por ejemplo, Cher identifica BRAF como predictor de la sensibilidad a PLX4720 inhibidor de la RAF y los inhibidores de MEK (AZD6244 y PD-0325901) en CCLE-SkinGlioma; ErbB2 como predictor de la sensibilidad a lapatinib (EGFR y ErbB2 inhibidor) en CCLE-BreatOvary; ABL1 para la sensibilidad a los inhibidores de ABL1 (AZD0530, nilotinib) en CCLE-Blood (Tablas S3-S5).

El conocimiento de la salud

Enfermedades de sentido común

Enfermedad del corazón | Enfermedades artículos | Enfermedad pulmonar | las preguntas más frecuentes de salud | Salud mental | Diabetes | El sentido común de la Salud | Enfermedades comunes | senior Health | Primeros auxilios
Derechos de autor © Crónica enfermedad[www.enfermedad.cc]