Crónica enfermedad > Cáncer > artículos del cáncer > PLOS ONE: Integrativa análisis genómico de la línea germinal Revela Extended homocigosis con cáncer de pulmón de Riesgos en el PLCO Cohort

PLOS ONE: Integrativa análisis genómico de la línea germinal Revela Extended homocigosis con cáncer de pulmón de Riesgos en el PLCO Cohort


Extracto

La susceptibilidad a los cánceres comunes es multigénica resultante de de baja a alta penetrancia predisposición-factores y la exposición ambiental. Los estudios genómicos sugieren homocigosis línea germinal como un nuevo factor de baja penetrancia contribuir a cánceres comunes. La hipótesis de que los genes de las regiones largas homocigotos (tractos-de-TOH homocigosis []) el puerto de tabaco-dependientes e independientes de la predisposición del cáncer de pulmón (o protección). Se realizó i
n silico
análisis basado en el SNP-array de todo el genoma de los pacientes con cáncer de pulmón de ascendencia europea de la cohorte de cribado-PLCO para identificar regiones TOH entre los 788 casos de cáncer-830 y la ascendencia de concordancia controles. Los análisis de asociación se realiza entonces entre la presencia de cáncer de pulmón y común (c) tohs (definido operacionalmente como 10 o más sujetos que comparten ≥ 100 llamadas homocigotos idénticos), aTOHs (grupos emparejados allelically-dentro de un cTOH), la demografía y el tabaco-exposición. Por último, la integración de significativa c /Atoh con transcriptoma se realizó para funcionalmente mapa de riesgo de cáncer de pulmón-genes. Después de controlar la demografía y el tabaquismo, se identificaron 7 cTOHs y 5 aTOHs asociados con el cáncer de pulmón (ajustado p & lt; 0,01). Tres cTOHs se sobre-representados en los casos respecto a los controles (OR = 1,75 a 2,06, p = 0,007-0,001), mientras que 4 están insuficientemente representadas (OR = 0,28 a 0,69, p = 0,006-0,001). No se observó interacción entre el consumo de tabaco y cTOH3 /aTOH2 (2p16.3-2p16.1) (p ajustada & lt; 0,03). Los aTOHs significativos restantes tienen RUP 0,23-0,50 (p = 0,004 hasta 0,006) y de 2,95 a 3,97 (p = 0,008 a 0,001). Después de integrar significativas cTOH /aTOHs con públicamente disponibles de cáncer de pulmón transcriptoma conjuntos de datos seguido de filtración basado en el cáncer de pulmón y de sus vías pertinentes revelado 9 putativo genes predisponentes (p & lt; 0,0001). En conclusión, distribuido diferencialmente-cTOH /Atoh variantes genómicas entre los casos y controles albergar conjuntos de posibles genes expresados ​​diferencialmente que explican la complejidad de la predisposición del cáncer de pulmón

Visto:. Orloff MS, Zhang L, G Bebek, Eng C (2012) Integrativa análisis genómico de la línea germinal Revela Extended homocigosis con cáncer de pulmón de Riesgos en el PLCO cohorte. PLoS ONE 7 (2): e31975. doi: 10.1371 /journal.pone.0031975

Editor: Amanda Ewart Toland, Ohio State University Medical Center, Estados Unidos de América

Recibido: 10 de octubre 2011; Aceptado 16 de enero de 2012; Publicado: 27 Febrero 2012

Derechos de Autor © 2012 Orloff et al. Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons Attribution License, que permite el uso ilimitado, distribución y reproducción en cualquier medio, siempre que el autor original y la fuente se acreditan

Financiación:. La CE recoge la Sondra J. y R. Stephen Hardis Cátedra de Medicina Genómica del cáncer de la Clínica Cleveland y la Clínica Cátedra de Investigación Sociedad Americana del cáncer. Estos fondos Silla han apoyado, en parte, algunos de FTE de los autores para llevar a cabo este estudio (incluyendo MO y la hora de la CE). No se recibió financiación externa adicional para este estudio. Los donantes no tenía papel en el diseño del estudio, la recogida y análisis de datos, decisión a publicar, o la preparación del manuscrito

Conflicto de intereses:.. Los autores han declarado que no existen intereses en competencia

Introducción

Existen dos grandes grupos histológicos en el cáncer de pulmón, cáncer de pulmón de células pequeñas (SCLC) y el cáncer de pulmón de células no pequeñas (NSCLC). Este último incluye adenocarcinoma (AC) y el carcinoma de células escamosas (SCC), junto con los subtipos menos comunes. Ha sido ampliamente aceptado que un promedio de 5 a 10% de todos los tumores malignos son causados ​​por genes de predisposición de alta penetrancia [1] - [3]. Por ejemplo, hay 10 genes de penetrancia altos, incluyendo
BRCA1 /2 Opiniones y
PTEN
, que representan el ~ 10% de todos los cánceres de mama [3]. Mientras que los cánceres del tracto aerodigestivo se cree que son una parte rara del espectro neoplásica de
BRCA2
, ningún otro gen del cáncer de pulmón-predisposición alta penetrancia ha sido identificado, y hasta hace poco, el cáncer de pulmón se ha atribuido casi por completo a la exposición del medio ambiente, principalmente tabaco. En los últimos años, sin embargo, se ha hecho evidente que una mayor, pero variable, la proporción de todos los tumores malignos tienen un componente genómico, conferir predisposición más débil (baja penetrancia). Por ejemplo, un estudio de asociación de genoma completo (GWAS) demostró polimorfismos específicos de nucleótido único (SNPs) asociados al riesgo de AC en los fumadores y los no fumadores [4]. Hasta la fecha, asociada-AC NSCLC, especialmente genómico-loci han sido identificados en 15q25, 5p15 y 6p21 [5] - [10]. El análisis del efecto del tabaquismo sobre el riesgo de cáncer de pulmón mostró que fumar no explica por completo el riesgo de desarrollo de cáncer de pulmón y que residuales genómicas-factores que interactúan con el tabaquismo es probable [4]. variantes genómicas, tales como los SNPs asociados, no pueden explicar completamente la heterogeneidad asociada con los subtipos histológicos bien [11], [12]. La evidencia hasta la fecha sugiere la necesidad de encontrar otros tipos de variación genómica que puede explicar el relativamente grande el riesgo restante asociado a los carcinomas de pulmón.

En la cría de animales y el modelo animal de experimentación, la endogamia que se traduce en el aumento de homocigotos loci se reconoce bien para dar lugar a aumento de la incidencia de varios trastornos, incluyendo el aumento de la incidencia de tumores [13]. En los seres humanos, la homocigosidad de la línea germinal como un factor genómica asociada con enfermedad de riesgo es un concepto relativamente reciente. Por ejemplo, la homocigosidad de la línea germinal, un tipo de variación genómica, se ha demostrado que se asocia con un mayor riesgo de cáncer de cuello uterino humano. La identificación de homocigotos loci como factores de riesgo puede ayudar mayor objetivo de cribado cervical para mujeres de alto riesgo [14] - [18]. En relación con esto, un estudio relativamente reciente descubrió una frecuencia significativamente mayor de homocigosis de la línea germinal en una serie de individuos blancos no relacionados con carcinomas de mama invasivo, carcinomas de próstata y cuello de células escamosas caricinomas por todo el genoma de microsatélites genotipado [19]. Esta asociación fue validado en un estudio de casos de CA y-controles emparejados que fueron genotipo con matrices densas basados ​​en SNP (Illumina matriz HumanHap550v3_B), apoyando así la alta probabilidad de identificar genotipos homocigotos que están asociadas con una amplia variedad de tumores sólidos comunes [ ,,,0],19]. Este estudio observó que la homocigosidad de ambos análisis microsatallite- y basados ​​en SNP mostró específica, loci compartida de homocigosis para todos los tres tipos de tumores estudiados. Además, también había loci altamente homocigotos que son específicos para cada uno de los tipos de tumores. Independientemente, Bacolod y colegas [20] encontraron que las largas extensiones de homocigosis (TOH), operacionalmente definidos como que abarcan por lo menos 4 Mb, estaban sobrerrepresentadas en los pacientes con cáncer colorrectal más controles.

A continuación, la hipótesis de que la línea germinal -regional que involucra la homocigosis loci cromosómicos específicos es un factor que contribuye a genómico novedoso de bajos a moderados predisposición a la penetrancia (o protección de) cáncer de pulmón. En lugar de identificar los genes individuales, nuestra hipótesis tiene en cuenta los subconjuntos de genes dentro de estas regiones, que se expresan diferencialmente a prestar la predisposición al cáncer de pulmón compleja. Hemos tratado de hacer frente a esta hipótesis mediante la integración sistemática de los datos diferencialmente representados regiones TOH con los datos de expresión de todo el genoma para localizar regional loci predisposición del cáncer de pulmón.

Métodos

Adquisición de datos de genotipo dbGaP

los genotipos se obtuvieron de la próstata, pulmón, colorrectal y ensayo de cribado del cáncer de ovario (PLCO), donde la cohorte prospectiva de pulmón se rastreó con radiografías de tórax [21]. Los sujetos fueron todos los auto-identificados como blancos, y comprenden los casos y controles [21] Con base en el principio-componente de ascendencia emparejados análisis utilizando ambos SNPs disociados de cáncer de pulmón y su ascendencia en datos SNP, según lo descrito por Patterson et al [22]. En consonancia, la CEPH (Centre d'Etude du polymorphisme Humain) de Utah (CEU) HapMap controla clúster con esta población, que volvía a confirmar el origen y el norte de Europa occidental [23].

Seguimos el control de calidad estándar ( procedimiento QC) utilizado en el estudio original [4]. Las muestras fueron evaluados y seleccionados solamente si tenían una tasa de éxito genotipo llamada 95% como mínimo. SNPs con frecuencias menores alelo (MAF) & lt; 5%, salidas de equilibrio de Hardy-Weinberg (P & lt; 0,01) y ≥5% missingness por SNP, fueron excluidos de los nuevos análisis. Después de la filtración del control de calidad, teníamos 1618 sujetos (788 casos y 830 ascendencia controles pareados) con categorías de edad media de 1,63 (5 categorías definidas en la Tabla S1), que comprende 967 varones y 651 mujeres, entre ellos 156 fumadores, 703 ex fumadores y 759 fumadores actuales (Tabla S1); y un promedio 526.826 (514.355 autosómico) SNPs (93,8%) /sujeto. Tabla S1 muestra el análisis de asociación basado en un modelo logístico con la edad, el sexo y la condición de fumador (nunca ahumado, el fumar anterior y fumar en la actualidad) como covariables después de excluir los posibles efectos genéticos. Es importante tener en cuenta que la proporción de fumadores actuales era aproximadamente la mitad de la tasa de fumadores activos en la población general de Estados Unidos. Se observó que el cumplimiento fue el más bajo en los fumadores actuales mientras que los fumadores anteriores fueron los más compatible.

Cuantificación Tracts de homocigosis y frecuencias Comparando los casos de cáncer y controles

Identificación de extensiones de homocigosis ( TOH) y la región común TOH (cTOH).

Hemos ampliado el módulo de pistas de homocigosis en el software GoldenHelix [24] para identificar tohs [un software propio (Zhang et al, inédito)]. A continuación, se examinaron los datos de todos los sujetos para determinar si un número mínimo de personas comparten una llamada TOH en una posición dada. Para determinar las diferencias estadísticas entre tohs dentro de un diseño de casos y controles, sólo retuvo a aquellos tohs en el que 10 o más sujetos comparten 100 llamadas homocigotos idénticas, que operacionalmente definimos como un TOH común (cTOH). Hay 333,861 SNPs con 10 o más TOH llama a lo largo de toda la serie, lo que representa el 65% de la piscina original de SNPs.

Detección de cTOHs asociado con el cáncer de pulmón.

A continuación, siguió la prueba de asociación entre los casos de cáncer de pulmón y cTOH. Al considerar cada cTOH como una variante genómica, se llevó a cabo un análisis de casos y controles de todo el genoma para cada cTOH, donde un cTOH fue visto como una variable binaria basada en la presencia o ausencia de un cTOH. El uso de cada uno TOH (que contienen múltiples SNP que están en desequilibrio de ligamiento) como una variable, se reduce considerablemente el número de pruebas a realizar y aumentar el poder del análisis de asociación. Los estudios tradicionales único SNP-asociación requieren por lo menos 610 000 (hasta 3 millones si se utilizan más SNPs) pruebas si se hizo un GWAS tradicional. Un modelo logístico se ajustó para cada cTOH teniendo en cuenta el estado de la enfermedad como el resultado y la cTOH como el predictor. Otras variables incluidas en el modelo fueron la edad, el sexo y la condición de fumador. P-valores fueron obtenidos por Wald prueba y OR (IC del 95%) se calcularon mediante estimaciones de los coeficientes del modelo logístico equipada. Para detectar las interacciones entre cTOH y el consumo de tabaco, y cTOH y edad, un modelo logístico con dos términos de interacción adicionales se ajustó para cada cTOH. El P-valor de la interacción se obtuvo por F-test. Para minimizar las posibilidades de resultados falsos positivos, cTOHs se consideran estadísticamente significativo si su p & lt; 0,01 [24]. Por otra parte, el enfoque de valor q [25], que se basa en el concepto de la tasa de falso descubrimiento, fue utilizado como una guía de exploración para los que las variantes llamadas pueden investigarse más a fondo.

Investigación de los grupos emparejados allelically- dentro de un cTOH (Atoh).

Como se ha señalado anteriormente, una cTOH se define operacionalmente por un número mínimo de loci que son homocigotos y número mínimo de sujetos que comparten la cTOH, pero no coincidencia cualitativa de nucleótidos. Dentro del cTOH, segmentos TOH se compararon por pares y un partido alélica se declara si al menos 0,95 de forma conjunta no perdidos, los sitios de manera conjunta homocigotos son idénticos. Estos grupos de alelos de tohs dentro de un cTOH juego se denominan 'allelic'TOH (Atoh). La caracterización y la exploración de estos aTOHs se realizó a través de nuestro software a medida
cag-TOH gratis (software no publicado), similar al procedimiento alélica de coincidencia en PLINK [26].

Detección de aTOHs asociados con los casos de cáncer de pulmón.

El Atoh como entonces se utilizó para el análisis genómico variante de asociación dentro de un marco de casos y controles. Para conservar la potencia del análisis estadístico, sólo nos centramos en los aTOHs que están presentes en al menos 5 casos y 5 controles. Para cada Atoh, se aplicó un modelo logístico con el estado de la enfermedad como el resultado y Atoh como predictor con la edad, el sexo y el consumo de tabaco como covariables. Al igual que en cTOH anteriormente, los aTOHs con p & lt; 0,01 por Wald-test son declarados significativamente asociados con el cáncer de pulmón. También se aplica el enfoque de valor q [25].

La integración de la información genética de c Significativo /Atoh Regiones disponible al público con expresión de matriz de conjunto de datos

Los datos se obtuvieron a partir de un gen a disposición del público [27] -expresión conjunto de datos de 107 muestras frescas congeladas de tejido de tumor de CA (58 y 49 tejidos no tumorales procedentes de 20 no fumadores, 26 ex fumadores y 28 fumadores actuales) descargados de la Expresión génica Omnibus (GSE10072), desde el medio ambiente y la genética en estudio del cáncer de pulmón Etiología (EAGLE) (http://dceg.cancer.gov/eagle). Los criterios utilizados para seleccionar este conjunto de datos de arreglo en particular no sólo proporcionan un sesgo mínimo, pero los datos fisiológicamente relevantes. Hemos seguido el estándar universal de que los criterios de selección específicos y control de calidad de están en su lugar antes de usar conjuntos de datos disponibles públicamente (por ejemplo, expresión serie) para los propósitos de integración de plataforma cruzada. Por lo tanto, nos aseguramos de que los cánceres de pulmón en los conjuntos de datos de expresión de la matriz pertenecen a los pacientes que son similares a aquellos pacientes que se genotipo y sometidos a análisis TOH. Por ejemplo, los pacientes utilizados tanto en gama de expresión y análisis TOH representan dos subconjuntos diferentes de uno mucho más grande cohorte de estudio. Esto por sí mismo es una de las principales de este proceso de integración multiplataforma ya que los pacientes en los dos conjuntos de datos fueron sometidos a los mismos criterios de inclusión /selección; estos individuos han sido expuestos a condiciones ambientales o de tratamiento similares; lo más importante, el fondo ancestral de los pacientes "expresión de matriz de conjuntos de datos" fueron similares a los que se genotipo para el análisis TOH; y los pacientes son de los mismos rangos de edad, es decir, de 55-60 años. Después del control de calidad, que normalizó los perfiles de expresión de las muestras utilizando el método robusto multichip media (RMA), similar a cómo se procesaron originalmente la misma expresión serie de datos [28]. Las sondas primas se asignan a sus correspondientes genes, y se promediaron múltiples sondas correspondientes a los mismos genes. Las regiones importantes cTOH se extendieron primero 250 kb en cada dirección, y se identificaron los genes dentro de estas regiones (259 genes). El número de genes incluidos en la región aumenta linealmente a medida que las regiones flanqueantes se extienden, pero también depende de siendo interrogado la región (es decir, si un gen rico o pobre región del gen). Si se devuelve & gt; 1000 genes (que no observamos en nuestros análisis aquí), tendríamos LD simplemente se utiliza para capturar el bloque de cTOH o Atoh. Los perfiles de expresión de microarrays de 153 de los 259 cTOH-genes se encuentran en la gama de expresión. Posteriormente, se evaluó en un
a priori
diferencias de criterios en los perfiles de expresión de estos genes utilizando 153 de regresión logística univariante individuo con corrección de Bonferroni se aplica para los cálculos de significación estadística (datos no mostrados). perfiles de expresión de los genes importantes desde el análisis univariado (p & lt; 0,01) y dentro del +/- 250 kb región de c /región Atoh fueron sometidos a la agrupación jerárquica sin supervisión [29] utilizando Matlab

Priorización de Candidato. los genes

Después de la integración de las regiones importantes c /Atoh con el conjunto de datos gama de expresión, a fin de determinar el riesgo asociado con la expresión diferencial de los genes con c /aTOHs estratificados por el consumo de tabaco. Genes que mostraron expresión diferencial perfiles significativas a p & lt; 0,0001 en la siempre y nunca fumadores estratos luego fueron sometidos a un enfoque de minería de texto para ayudar a filtrar a partir de la información relevante generada a partir de genómica, transcriptómica, y las investigaciones proteómicos disponibles en la base de datos literatura PubMed. En consecuencia, esta información se utiliza para identificar las redes de relaciones entre los genes, sus transcripciones, sus proteínas y otros procesos biológicos cáncer de pulmón o vías pertinentes [30] - [32].

Resultados

identificación de los tractos específicos comunes de homocigosis (cTOH) en individuos con cáncer de pulmón en la cohorte PLCO

Para hacer frente a nuestra hipótesis central que TOH línea germinal específica es ya sea sobre o sub-representados en los casos de cáncer de pulmón más ancestry- controles de la misma, que inicialmente se seleccionaron para las regiones TOH en el conjunto de datos (PLCO-esquema en la Figura 1). Encontramos un total de 91,460 tohs en todas las muestras con 44,725 tohs en los casos y en los controles 46,735 tohs. Duración media de la tohs era 886 kb (mediana = 677,4 kb, 1
er cuartil = 484,8 kb, 3
er cuartil = 956,3 kb) y el número medio de SNPs dentro de cada TOH 141,4 (mediana 121, 1
st quartile108, 3
er cuartil = 145). Un total de 890 tales cTOHs fueron identificados en todo el genoma, que varían en tamaño desde 141,6 hasta 3421 kb (media = 2,144 kb, SD = 3115.6 kb, mediana = 1,064 kb, 1
er cuartil 623,9 kb, 3
er cuartil 2144 kb) y SNP-recuento de 100 a 413 (media = 375, SD = 418, mediana = 215).

el esquema representa el marco utilizado para identificar y posteriormente integrar cTOHs y aTOHs significativas (del PLCO de pulmón ensayo de cribado del cáncer) con conjuntos de datos globales del transcriptoma que comparan los cánceres de pulmón a los pulmones normales (de la prueba de detección del cáncer de pulmón EAGLE). Múltiples genes expresados ​​diferencialmente dentro del cTOHs y aTOHs habían su candidatura priorizado inicialmente con base en la significación estadística seguido de plausibilidad biológica (por ejemplo, modelos de ratón correspondientes, notificados como somáticamente alterados en los cánceres de pulmón esporádicos, vías de señalización pertinentes, etc.) para obtener finalmente 9 " la mayoría de los "genes candidatos plausibles y región genómica uno de los candidatos. Este último es designado así porque se deriva de forma independiente (por este estudio actual) y, posteriormente, se encontró a solaparse con la región previamente identificada en 3 estudios previos como asociados con el riesgo de cáncer de pulmón.

Al considerar cada cTOH como una variante genómica, se realizó un análisis de casos y controles para ajustar los efectos de la edad, sexo y tabaquismo. Se encontraron siete regiones cTOH ser significativamente diferencialmente representados entre los casos de LC y los controles basados ​​en p & lt; 0,01 (Tabla 1, Figura 2 A y en la Tabla S2) [38 regiones cTOH se encontraron en p & lt; 0,05 (datos no mostrados)]. Tres regiones cTOH, cTOH2, 4 y 7 (a menos de 1p12, 3p24.2-3p24.1 y 9p22.3, respectivamente), tienen razones de posibilidades (OR) = 1,75 a 2,06 (p = 0,007 a 0,001), mostrando un exceso de representación de estos 3 cTOHs en los casos de cáncer de pulmón más controles (Tabla 1 Tabla S2, y las figuras 3C y 3D). Las cuatro regiones restantes cTOH, cTOH1, 3, 5 y 6 (1p13.2, 2p16.3-2p16.1, 5p15.31 y 6p22.3-22.2) tienen OR = 0,28 a 0,69 (p = 0,006 a 0,001), que esas de cTOH están insuficientemente representadas en los casos en comparación con los controles (Tabla 1, Tabla S2, y en las Figuras 3A y 3B).

análisis de asociación de un solo SNP se llevó a cabo de forma independiente de análisis de TOH y comparados. Las asociaciones significativas de SNPs individuales, y cada TOH con los casos de cáncer de pulmón en comparación con los controles, y sus respectivos IC del 95% (líneas discontinuas de color), se muestran. A continuación cada uno de los paneles inferiores son los nombres de genes candidatos (multicolor), que fueron priorizados después de evaluar la asociación entre el cáncer de pulmón y la expresión diferencial de cada uno de los genes dentro y +/- 250 kb del TOH, estratificada por el consumo de tabaco (p & lt ; 0,0001; véase la sección Métodos). A. cTOH3 /región Atoh1 (2 p16.3-16.1; línea marrón) significativamente sub-representadas en los casos de cáncer de pulmón y SNPs identificados-GWAS (puntos de color púrpura) en la misma región (panel superior) con sus respectivos riesgos correspondientes como odds ratios (panel inferior). B. aTOH4 (7q21.11; línea marrón) significativamente sub-representadas en los casos de cáncer de pulmón y SNPs identificados-GWAS (puntos de color púrpura) de la región (panel superior) con sus correspondientes riesgos de cáncer de pulmón como odds ratios (OR; panel inferior ).

Los SNPs significativos asociados con el cáncer de pulmón individuales, y TOH de saber cTOH1, cTOH2, cTOH5, y cTOH7, y sus respectivos IC del 95% se muestran. La asociación de cáncer de pulmón significativa de aTOHs y SNPs en la región (panel superior) y el riesgo correspondiente como odds ratio (panel inferior) se muestran en los paneles A-D. Por debajo de los paneles inferiores son genes candidatos que fueron priorizados después de evaluar la asociación entre el cáncer de pulmón y la expresión diferencial de cada uno de los genes dentro de cada TOH significativa +/- 250 kb TOH, estratificada por el consumo de tabaco (p & lt; 0,0001; véase la sección Métodos) .

Curiosamente, la interacción entre el consumo de tabaco y (rs4672095 rs733726 [2p16.3-2p16.1]; Tabla 1) cTOH3 se observó (p & lt; 0,03, Tabla S3). Mientras misma edad, sexo y tabaquismo-estado-OR ajustada para cTOH 3 es 0,69 (Tabla 1, Figura 2 A), cTOH3 es de 2 veces (OR = 1,8) sobre-representados en los casos de no fumadores respecto a los controles no fumadores , mientras que cTOH3 es significativamente sub-representadas en los casos nunca fumadores respecto a los controles cada vez más fumadores [OR 0,78 (ex fumadores) y 0.34 (fumadores actuales), respectivamente, p = 0,009 a 0,026] (Tabla S3 B).

identificación de Grupos Allelically-juego (Atoh) dentro cTOHs en casos y controles de cáncer de pulmón

los aTOHs pueden proporcionar antecedentes genéticos o información relacionada con ascendencia-, por lo tanto, una asociación significativa con el fenotipo biológico del cáncer de pulmón. El número de aTOHs en cada cTOH varía de 1 a 111. Se realizó un análisis de casos y controles independientes (de cTOHs identificado), seguido de ajustar por los efectos de la edad, el sexo y el consumo de tabaco en el fenotipo del cáncer de pulmón. De esta manera, se identificaron 5 aTOHs (a menos de 2p16.3-2p16.1, 3p25.3, 5q11.2-12.1, 7q21.11 y 13q31.1-31.3) que están representados significativamente diferente entre los casos y controles (basado en p & lt; 0,01; Tabla 2). Cabe destacar que sólo Atoh1 con OR de 0,5 (Tabla 2), se deriva de los padres cTOH3 (2p16.3-16.1) donde ambos cTOH3 y Atoh1 están sub-representadas en los casos de cáncer de pulmón en comparación con los controles (OR = 0,69 y 0,5, p = 0,001 y 0,005, respectivamente; Figura 2, Tablas 1 y 2). Las regiones restantes, Atoh aTOH2, 3, 4 y 5 (a menos de 3p25.3, 5q11.2-12.1, 7q21.11 y 13q31.1-31.3, respectivamente) tienen OR = 3,97, 0,23, 2,95 y 0,39, respectivamente (p = 0,001 a 0,008;. Tabla 2) guía empresas
Genómica funcional Validación de Integración de cTOH significativo y Atoh Regiones con Global transcriptoma Conjuntos de datos

a continuación centramos nuestra atención en buscar genes biológicamente plausibles , es decir, uno o un subconjunto de todos los genes, que se encuentra dentro y en las proximidades (+/- 250 kb) a significativos de C /Atoh y que puede ser pertinente para el riesgo de cáncer de pulmón. Para multa mapa tohs que contienen los genes relacionados con el cáncer de pulmón y para validar funcionalmente nuestros datos genómicos, hemos integrado nuestras regiones significativas TOH con los datos de expresión de genes derivados de pacientes con cáncer de pulmón en el estudio EAGLE [27] (Figura 1). Este conjunto de datos se deriva de una población de ascendencia europea (criterios de selección descritos en la sección Métodos) y también sirvió como nuestra serie validación funcional. Hemos sido capaces de filtrar los genes dentro de las regiones importantes c /Atoh de 46 genes sobre la base de la expresión diferencial en el análisis univariado solos (Figuras 1 y 4). Con un mayor análisis de riesgos y la integración con la función específica de órgano conocida y señalización papeles de la vía, terminamos con una lista final de los 9 genes en el riesgo de cáncer de pulmón más plausibles y región genómica de un candidato (p & lt; 0,0001; Tabla 3 y la Figura 1; ver Discusión).

Bi-agrupación de la expresión génica relativa (horizontal), clasificada por "LC (tumor) + el consumo de tabaco" y "normales + el tabaquismo" (vertical). La adquisición, re-normalización y la fusión de expresión serie de datos con regiones TOH se detallan en la sección Métodos. coloración roja en el mapa de calor es relativa sobre-expresión de los genes, azul denota relativa bajo-expresión y blanco ninguna diferencia expressional relativa distinta observada. El mapa de calor representa los perfiles de expresión diferencial de 47 genes que fueron seleccionados tras un análisis univariado (véase la sección Métodos para más detalles). Los perfiles de expresión de genes que residen dentro y en las proximidades de las regiones c /Atoh que están asociados con el consumo de tabaco diferenciar los carcinomas de pulmón a partir de tejido pulmonar normal.

asociación particular examinado la acogida de la tohs estos 9 genes y el hábito de fumar. En relación con esto, los 9 genes expresados ​​diferencialmente en los 6 cTOH /Atoh son pertinentes en nunca fumadores en comparación con los 3 que son pertinentes tanto en constante y que nunca habían fumado [(p & lt; 0,0001), Tabla 3]. Una excepción importante es
SBTBN1
y
RTN4 Bienvenidos en los cTOH3 /Atoh1 (2p16.3-16.1), donde la sobreexpresión se produce casi exclusivamente en los controles relativos a los casos de cáncer de pulmón, independientemente del hábito de fumar estado (OR = 0,000 y 0,08, p & lt; 0,0001, Tabla 3, las Figuras 2A y 4).
ACYP2 gratis (OR = 0,08, p & lt; 0,0001), también dentro de este TOH, no está suficientemente expresada en nunca fumadores asociados con la disminución de cáncer de pulmón en el riesgo, pero su expresión diferencial no es pertinente en los no fumadores (Tabla 3, las Figuras 2A y 4). En general, se observaron únicas firmas de expresión diferenciales para grupos de genes dentro de un /cTOHs como se muestra en la Tabla 3 y la Figura 4. Análisis de perfiles de expresión de genes en otras aTOHs, por ejemplo,
CD36
en aTOH4 (7q21.11) , mostró menores de expresión en los casos entre nunca fumadores (p & lt; 0,0001, Tabla 3 y la Figura 2B).

perfiles de expresión de los genes ubicados en otras cTOHs significativos, cTOH1, 2, 5 y 7 (1 p13 0,2, 1p12, 5p15.31 y 9p22.3, respectivamente; se analizaron Tabla 1).
OLFML3 gratis (1p12; Figura 3A), estaba bajo-expresó en casos cada vez más fumadores en comparación con los casos consistentes con un riesgo reducido no fumadores según lo retratado por OR de & lt; 1 (Tabla 3 y Figura 4). En contraste
WDR3 gratis (en 1p12; Figura 3B) mostraron relación significativa sobre-expresión con independencia de la condición de fumador, consistente con el TOH-pertinente o & gt; 1 (Tabla 3 y Figura 4).
FASTKD3 gratis (en 5p15.31; Figura 3C) mostró significativa relativa sobre-expresión en los casos de cáncer de pulmón nunca fumadores en comparación con los casos no fumadores, consistente con el TOH-pertinente o & gt; 1 (Tabla 3 y Figura 4).
PSIP1 gratis (en 9p22.3; Figura 3D) fue significativamente bajo-expresados ​​en ambos casos siempreverdes y nunca fumadores, O & lt; 1 (Tabla 3 y Figura 4). En general, se observó firmas expressional únicos y similares para genes de conjuntos específicos (Tabla 3, Figura 4). Por ejemplo, se observó neto en la expresión de un conjunto de genes dentro de la cTOH3 en los casos de cáncer de pulmón que son fumadores (O & lt; 1) [Tabla 3, Figura 4]

Discusión

Identificación. factores de riesgo, ya sea genética o ambiental, de las neoplasias malignas, como el cáncer de pulmón, es un comienzo para el diagnóstico precoz, y la adaptación de vigilancia y prevención aumentadas. La hipótesis del cáncer variante común común prevalente en la última década llevó a GWAS rendimiento SNPs comunes dentro de 15q25, 5p15, 6p21 y asociado con el cáncer de pulmón [5] - [10], lo que representa ~ 3% de todos los cánceres de pulmón. Sobre la base de la hipótesis de trabajo de que otros factores genómicas que predisponen a la o el descenso debe existir el riesgo de cáncer de pulmón, se realizó un análisis de casos y controles de todo el genoma para tohs largas, cada una de las cuales alberga uno a varios pulmón de predisposición al cáncer o loci de protección (la mayoría probable de baja penetrancia a moderada). Se identificaron 7 cTOHs y 5 aTOHs que son significativamente sobre o sub-representadas en los casos de cáncer de pulmón en comparación con los controles, después de ajustar por edad, sexo y tabaquismo. Curiosamente, encontramos específicos cTOH /aTOHs asociados a los casos respecto a los controles independientes de estas covariables, con otros que dependen de la condición de fumador.

Es importante destacar que nuestras regiones cTOH y Atoh significativos identificados han sido validados funcionalmente mediante la integración de la expresión diferencial de concreto genes que residen en estos intervalos críticos, mostrados previamente para jugar al menos un papel somática en los carcinomas de pulmón humanos esporádicos, en modelos murinos y /o participar en las vías de señalización de neoplasia asociada (Tabla S4). Creemos que la búsqueda de agnóstico cTOH y Atoh y luego la integración con datos de expresión son métodos poderosos para encontrar, y al mismo tiempo funcionalmente genómicamente validar, nuevas regiones cáncer riesgo de pulmón y genes. Tres estudios GWAS cáncer de pulmón previos han identificado la región 5p15 estar asociado con casos de cáncer de pulmón [4] - [10]. cTOH5 se encuentra dentro de 5p15.31 (nuestro "región genómica candidata" después de un análisis integrador) y es 11 veces sobre-representados en los casos de cáncer de pulmón nunca fumadores y 3 veces en los casos de cáncer de pulmón no fumadores. Esto sirve como un control positivo fuerte. También hemos identificado un nuevo gen candidato
FASTKD3
, más allá de los anteriormente postula, por la integración de la expresión con TOH significativa en esta región (Tabla S4).

Sólo se encontró una región donde un TOH Atoh significativa se encuentra dentro de su matriz cTOH: Atoh 1 (2p16.3-16.1) y su matriz cTOH3, cuya presencia parece conferir un efecto protector contra el cáncer de pulmón en los casos nunca fumadores (O & lt; 0,7, es decir, sobre-representados en los controles en comparación con los casos; Tablas 1 y 2). Expresión diferencial de un grupo de genes en esta región parece ser igualmente protector contra el cáncer de pulmón, independientemente de la condición de fumador o de la historia (Tabla 3, Figura 4). Por ejemplo,
SPTBN1
codifica una beta-SPECTRIM que desempeña un papel en la disminución del reclutamiento superficie celular de CD45 y CD3, y la derogación de la función de células T [33]. En consecuencia, el aumento de
SPTBN1
expresión (y la sobrerrepresentación de Atoh1 /cTOH3 en los controles sobre los casos) plausiblemente podría proteger contra el cáncer de pulmón mediante el aumento de la vigilancia inmunológica, ya que sabemos que fumar suprime la proporción de células T CD4 /CD8 [34]. Si bien existe evidencia convincente existente que bajo la expresión de los genes dentro cTOH3 /Atoh1 (Tabla 3, Tabla S4, Figura 4) sería de protección a través de distintos mecanismos [35], no se sabe cuáles son los mecanismos por descubrir como consecuencia una mayor mitigación del tabaquismo asociado el riesgo de cáncer de pulmón. A diferencia de los otros genes en Atoh1 /cTOH3,
MTIF2
sobreexpresión se asocia con su TOH diferencialmente asociada con casos y controles.

El conocimiento de la salud

Enfermedades de sentido común

Enfermedad del corazón | Enfermedades artículos | Enfermedad pulmonar | las preguntas más frecuentes de salud | Salud mental | Diabetes | El sentido común de la Salud | Enfermedades comunes | senior Health | Primeros auxilios
Derechos de autor © Crónica enfermedad[www.enfermedad.cc]