Crónica enfermedad > Cáncer > artículos del cáncer > PLOS ONE: Impacto en el Desarrollo de la enfermedad, Genómica Ubicación y función biológica del número de copias alteraciones en células no pequeñas de cáncer de pulmón

PLOS ONE: Impacto en el Desarrollo de la enfermedad, Genómica Ubicación y función biológica del número de copias alteraciones en células no pequeñas de cáncer de pulmón


Extracto

El cáncer de pulmón, de los cuales más del 80% es de células no pequeñas, es la causa principal de muerte por cáncer en los Estados Unidos. alteraciones del número de copias (CNA) en el cáncer de pulmón han demostrado ser
posicionalmente
ha agrupaban en determinadas regiones genómicas. Sin embargo, no queda claro si los genes con los cambios de número de copias son
funcionalmente
agrupado. El uso de una matriz densa polimorfismo de nucleótido único, se realizó un análisis del número de copias en todo el genoma de una gran colección de tumores de pulmón de células no pequeñas (n = 301). Hemos propuesto una prueba estadística formal de CNA entre los diferentes grupos (por ejemplo, no involucrado pulmonares frente a los tumores, los primeros frente a tumores en estadios tardíos). También hemos personalizado el conjunto de genes de enriquecimiento de análisis (GSEA) algoritmo para investigar la sobrerrepresentación de los genes con el CNA en vías biológicas predefinidos y conjuntos de genes (es decir,
funcional
clustering). Se encontró que los eventos CNA aumentan sustancialmente de la línea germinal, etapa temprana de tumor en estadio tardío. Además de la posición genómica, CNA tienden a ocurrir lejos de los lugares de genes, especialmente en la línea germinal, los tumores de tejidos y de la etapa temprana no implicadas. Tal tendencia disminuye desde la línea germinal de etapa temprana y luego a los tumores en fase tardía, lo que sugiere una relajación de la selección durante la progresión del tumor. Por otra parte, los genes con CNA en los tumores de pulmón de células no pequeñas fueron enriquecidos en determinados conjuntos de genes y las vías biológicas que desempeñan papeles cruciales en la oncogénesis y la progresión del cáncer, lo que demuestra el aspecto funcional de la CNA en el contexto de las vías biológicas que fueron pasados ​​por alto con anterioridad. Llegamos a la conclusión que el aumento de la CNA con la progresión de la enfermedad y la CNA son a la vez
posicionalmente
y
funcionalmente
agrupados. Las capacidades funcionales potenciales adquiridos a través de la CNA puede ser suficiente para que las células normales se transformen en células malignas

Visto:. Huang Y-T, X Lin, Chirieac LR, R McGovern, Wain JC, Heist RS, et al. (2011) Impacto en el Desarrollo de la enfermedad, Genómica Ubicación y función biológica del número de copias alteraciones en células no pequeñas de cáncer de pulmón. PLoS ONE 6 (8): e22961. doi: 10.1371 /journal.pone.0022961

Editor: Pan-Chyr Yang, el Hospital de la Universidad Nacional de Taiwán, Taiwán

Recibido: 28 Marzo, 2011; Aceptado: 2 Julio 2011; Publicado: 2 Agosto 2011

Derechos de Autor © 2011 Huang et al. Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons Attribution License, que permite el uso ilimitado, distribución y reproducción en cualquier medio, siempre que el autor original y la fuente se acreditan

Financiación:. Este estudio con el apoyo de los Estados Unidos Institutos nacionales de la Salud (http://www.nih.gov/) no concede ninguna otra. CA092824 (D.C.C.), CA074386 (D.C.C.), CA090578 (D.C.C.); y la Sociedad de Cáncer de Noruega (http://www.kreftforeningen.no/english)(A.H.). Los donantes no tenía papel en el diseño del estudio, la recogida y análisis de datos, decisión a publicar, o la preparación del manuscrito

Conflicto de intereses:.. Los autores han declarado que no existen intereses en competencia

Introducción

el cáncer de pulmón, de los cuales más del 80% es de tipo no microcítico (CPNM), es el segundo cáncer más frecuente y la principal causa de muerte por cáncer en los Estados Unidos [1]. Se ha demostrado en estudios previos que NSCLC tumor tiene más alteraciones genómicas en región específica de los cromosomas, incluyendo los aumentos del número de copias de los brazos cromosómicos parciales o completas en 1q, 3q, 5p y 8q, y las pérdidas de copia en 3p, 6q, 8p, 9p, 13q y 17q [2], [3]. Es decir, las alteraciones del número de copias en cáncer de pulmón no ocurren al azar en el genoma, pero son
posicionalmente
ha agrupado. Sin embargo, cuando la falta de aleatoriedad viene, y además, si los genes con los cambios de número de copias son también
funcionalmente
agrupado sigue sin estar clara. El objetivo de este estudio es caracterizar los perfiles de número de copias en todo el genoma en el cáncer de pulmón de células no pequeñas, tanto
posicionalmente
y
funcionalmente
.

Hemos recogido 301 NSCLC muestras tumorales junto con 63 muestras de sangre pareadas y adyacentes 50 muestras de tejido normal emparejados. Entre las muestras de tumor, un subconjunto de ellos son de la última etapa (n = 25). Con la heterogeneidad de las muestras, que son capaces de establecer un modelo genómico de desarrollo de la enfermedad de genoma de la línea germinal (sangre) o genoma pre-cancerosos (tejido no involucrado adyacente), a genoma tumor en estadio temprano y luego a genoma tumor etapa tardía. Este modelo también nos permite estudiar las tendencias en el patrón de todo el genoma alteraciones del número de copias (CNA) y sus efectos de selección. Además de centrarse en el perfil CNA en muestras de tumores como los estudios anteriores, aquí se investigó aún más la diferencia del CNA en tejido no involucrado, etapa temprana y última etapa, así como entre el adenocarcinoma y el carcinoma de células escamosas. Con el fin de realizar una prueba estadística formal del patrón de CNA en todo el genoma entre los diferentes grupos, hemos propuesto una prueba global basado en la permutación, en el que las comparaciones múltiples, la correlación del número de copias y localización de loci sonda se ajustan plenamente.

análisis gene conjunto de enriquecimiento (GSEA) fue desarrollado originalmente para el análisis de arrays de expresión y se utiliza para identificar el exceso de representación de los genes pertenecientes a una categoría biológica particular, que se asocian con fenotipos biológicos (por ejemplo, el estadio, histología) [4]. Base de datos de firma molecular (MSigDB) es una colección de conjuntos de genes comisariada para su uso con GSEA. Aquí nos muestran que con la modificación del esquema de permutación, GSEA se puede adaptar a explorar la sobre-representación de los genes con el CNA en conjuntos predefinidos de genes MSigDB (es decir, "
funcional
agrupación").

En la "teoría cromosómica de cáncer", tumorigénesis es iniciado por aneuploidías [5], [6]. Para la tumorigénesis, se han propuesto seis capacidades adquiridas necesarias: la autosuficiencia en las señales de crecimiento, insensibilidad a las señales anti-crecimiento, la apoptosis evadir, el potencial de replicación ilimitado, angiogénesis sostenida y la invasión de tejidos y metástasis [7]. Dado que la hipótesis de que existe agrupación funcional de los genes con CNA, hemos tratado de investigar si la CNA son una estrategia mecánica suficiente para adquirir las capacidades anteriores; es decir, si la agrupación funcional de los genes con CNA proporciona evidencia de apoyo para la teoría cromosómica de cáncer.

Materiales y Métodos

Declaración de Ética

escrito el consentimiento informado se obtuvo de todos los pacientes. El estudio fue aprobado por las juntas de revisión institucional de MGH, la Escuela de Salud Pública de Harvard, y la Inspección de Datos de Noruega, y el Comité Regional local para la Investigación Médica.

Estudio de la población y las muestras

se recogió una serie de 301 muestras tumorales congeladas instantáneamente a partir de pacientes con CPNM durante la cirugía o biopsia del hospital general de Massachusetts (MGH), Boston, MA y el Instituto Nacional de Salud Ocupacional, Oslo, Noruega. También se incluyeron 50 muestras adicionales de parénquima pulmonar no neoplásico emparejado de los pacientes noruegos y 63 pares de muestras de sangre de los pacientes MGH, todos los cuales fueron utilizados como grupo de referencia del número de copias de estimación.

calidad del ADN, histopatología y GeneChip

Las muestras de ADN fueron extraídos de tumor y el parénquima pulmonar no neoplásico después de microdisección manual de los 5-mu secciones histopatológicas. Para los ADN de los pacientes MGH, un patólogo (L.R.C.) que no tenía conocimiento de la información clínica y genética revisó todas las secciones para cada paciente. Cada muestra se evaluó para la cantidad y la calidad de las células tumorales e histológicamente clasificado utilizando los criterios de la OMS. Las muestras de Noruega todo se resecaron recogen y se preparan de la misma manera. Las muestras con celularidad cáncer menor que 70%, la concentración de ADN insuficiente (& lt; 50 ng /l), o un patrón de manchas en la electroforesis en gel no se incluyeron para el genotipado. Un total de 414 muestras de ADN (301 por tumores, 63 de muestras de sangre pareadas y 50 a partir de muestras de pulmón no implicadas emparejados) se hibridó a Affymetrix 250K NSP GeneChip®, que contiene 262,264 256,554 sondas (sondas en los cromosomas somáticos y 5.710 sondas en el sexo cromosoma).

pre-procesamiento de datos

Copiar números se obtuvieron con el software dChip [8]. Las intensidades de la sonda se calcularon mediante la expresión basada en el modelo después de la normalización conjunto invariante. Para cada SNP en cada muestra, el número de copias en bruto se calcula como señal × 2 ÷ (media de la señal de las muestras de referencia en este SNP) usando muestras de sangre y de tejidos no neoplásicos como referente. el número de copias inferidos se calcularon a partir de los números de copias primas por medio de suavizado con la ventana de 11 SNPs para cada locus de 262,264 SNPs. Sólo se analizaron 256.554 sondas en los cromosomas somáticos. Las sondas de SNP fueron asignadas a los genes RefSeq con 2 kb de extensión tanto aguas arriba como aguas abajo usando la UCSC Genome Browser. Entre los 256,554 sondas en los cromosomas somáticos, 104,256 sondas fueron asignadas a 11.700 genes.

El análisis estadístico

Copiar las ganancias y pérdidas de números se analizaron por separado. Copiar ganancias numéricas se definieron como el número de copias inferidos (CN) ≥2.7 y copiar las pérdidas numéricas se definieron como se infiere ≤1.3 número de copias. Los cortes fueron elegidos para detectar el número de copias y ≥3 ≤1 al tolerar la contaminación tejido normal del 30%. Tenga en cuenta que el 70% de celularidad cáncer fue el umbral para el proceso de registro patológico de calidad. La prevalencia de los sujetos con CNA se representó en todo el genoma. Para cada locus, se suponía que el número de pacientes que tienen CNA sigue una distribución binomial con el tamaño de la muestra como el número total de sujetos y la probabilidad nula estimado empíricamente a partir de los datos: el total de las sondas con CN≥2.7 (o CN≤1.3) ÷ (256.554 × tamaño de la muestra). Importancia de las alteraciones del número de copias en todo el genoma se determinó mediante el cálculo de los valores exactos de p para cada uno de los loci 256.554, y los valores q se calcularon para el control de múltiples comparaciones entre el genoma utilizando la tasa de falsos descubrimiento [9], [10]. Para cada gen mapeado por múltiples sondas, la sonda con la mayor proporción de muestras que tienen CNA, o equivalentemente, el valor de p menor fue elegido para representar la función del gen CNA.

Aquí hemos propuesto una permutación de base prueba global de los patrones CNA en todo el genoma entre dos grupos eran diferentes, se aplicaron pruebas de dos muestras para datos binomiales mediante el cálculo de la diferencia estandarizada de dos proporciones para cada locus como: donde
p
ji es
la proporción estimada (estabilizado mediante la adición de 0,5 en el numerador) de las ganancias NC (o pérdidas) para el grupo
j
en el locus
i
y
n
j es
el tamaño de la muestra en el grupo
j
. Resumimos
D
i

2 más
i
en todos los loci 256,554 para calcular la diferencia estandarizada total observada al cuadrado (
D
observado
) en todo el genoma. Permutando los dos grupos y llevar a cabo el procedimiento anterior para 10.000 veces, hemos tenido una nula distribución no paramétrica (
D


nula
). A continuación, los valores de p se obtienen comparando
D

observado y
D


nula
. La ventaja de esta prueba propuesta es que proporciona una prueba global válida para la diferencia global de todo el genoma por lo que representa para comparaciones múltiples y correlación de CNA entre los diferentes loci
.
Uso de la prueba global se ha descrito anteriormente, hemos probado el patrones CNA en todo el genoma entre la sangre y los tumores pulmonares, no involucrado y tumores, tumores en fase inicial y en fase tardía, adenocarcinoma etapa temprana y tumores de carcinoma de células escamosas (Figura 1). A fin de confirmar los resultados, hemos realizado los siguientes análisis emparejados. Puesto que la sangre y muestras de pulmón no implicados se emparejaron al subconjunto de muestras tumorales, podemos comparar la diferencia de la CNA en todo el genoma restringidas a aquellos con muestras disponibles en la sangre y los tumores o en no involucrarse y tumores. Para cada tumor en estadio tardío, seleccionamos una muestra de tumor en estadio temprano correspondiente con paquetes-año más cercanos fumadores. La distribución de paquetes al año en el género, la histología y los fumadores no mostró diferencias significativas en los tumores en etapa emparejados temprana y tardía. Los análisis emparejados mostraron resultados similares a los de la Figura 1. (Figura S2)

El eje x representa lugares del genoma, que fueron ordenados por los cromosomas somáticos. El eje y representa la prevalencia (%) de los pacientes con CPNM que tienen el número de copias ≥2.7 (rojo o rosa) y ≤1.3 (azul o azul claro) en tejido no involucrado pulmón y total del tumor (A), tumor en estadio temprano y última etapa tumor (B), tumor etapa temprana de adenocarcinoma (C) y tumor etapa temprana de carcinoma de células escamosas (SCC) (D). Los correspondientes parcelas de -log
10 (valores q) se muestran en la Fig. S1. Los valores de p de comparación de patrones CNA en todo el genoma entre las muestras de tejidos no implicados y tumores totales son & lt; 0,0001 para las ganancias y las pérdidas por 0,40 para la prueba global basado en la permutación con los detalles descritos en los métodos. Los valores de p al comparar estadio temprano y tumores en etapas tardías son & lt; 0,0001 para las ganancias y pérdidas de 0,046 para; los valores de p que comparan el adenocarcinoma temprana etapa (C) y el carcinoma de células escamosas primera etapa (D) son 0,016 y 0,027 para las ganancias de las pérdidas.

Tanto las sondas totales (TP) y las sondas de localización dentro de los genes (GP) en el que se detectaron CNA se calcularon para cada individuo. Comparación de los TP y GP a través de diferentes subgrupos permite estudiar el patrón de selección de regiones genómicas, donde ocurre el CNA, bajo el supuesto de que las sondas en el chip se eligieron al azar sin tener en cuenta el desequilibrio de ligamiento. La relación de GP vs. TP (denominado como la relación G /T) se calculó para estimar la selección de CNA con respecto a la localización de genes. Bajo la hipótesis nula de que la CNA se producen al azar en relación con donde localizar los genes, esperaríamos que la relación nula de 104.256 /256.554 = 40,64%, donde 104.256 es el número de sondas ubicadas dentro de los genes en el chip. Mediante la comparación de los coeficientes de G /T a la nula relación de 40.64%, hemos sido capaces de probar si CNA ocurrido preferentemente lejos de los genes. La comparación de G /T en diferentes subgrupos (por ejemplo, la línea germinal vs. tumor) nos permitió investigar la magnitud de esta selección preferencial entre los diferentes grupos. Las comparaciones de proporciones entre dos grupos de TP, GP o G /T se realizaron mediante la prueba no pareada de Student bilateral t suponiendo varianzas desiguales.

análisis conjunto de genes se realizaron con el conjunto de genes de enriquecimiento de análisis algoritmo modificado (GSEA) . GSEA fue propuesto originalmente para la expresión de genes entre los grupos [4]. Dado que no se ha intentado asociar el CNA con otras covariables sino simplemente investigar el enriquecimiento de la CNA en un solo grupo, hemos modificado el algoritmo con respecto a la generación de nula distribución de la puntuación de enriquecimiento. Estamos interesados ​​en saber si CNA en un conjunto de genes son significativamente más altos que otros conjuntos de genes. En lugar de permutar la etiqueta de grupo, permutada las etiquetas de genes para 20.000 veces para crear la distribución nula. El descubrimiento (n = 151) y conjuntos de validación (n = 150) escogidos al azar de los 301 tumores fueron similares en muchas de las características demográficas y clínicas. (Tabla S1) El análisis primario se realizó utilizando los datos de descubrimiento y validación se ha realizado mediante la validación de datos. se informaron en ambos conjuntos, y sólo conjuntos de genes que fueron significativas (p & lt 0,05). Los conjuntos de genes analizados en este estudio se tomaron de la base de datos de firmas moleculares (MSigDB) del /Instituto Broad del MIT de Harvard, incluyendo las familias de genes, conjuntos de genes comisariada genes y conjuntos de genes ontología. Sólo se analizaron 1.619 conjuntos de genes con al menos 15 miembros de genes en nuestros datos para lograr robustez.

Resultados

CNA y el desarrollo de la enfermedad

Se recogió una serie de 301 muestras de tumores de pacientes con CPNM, las características de los que se muestran en la Tabla S1. El genoma de sangre o tejido de pulmón no involucrado tenía sustancialmente menos CNA eventos que hacían el genoma del tumor, especialmente en las ganancias de número de copias (pérdidas: p = 0,038 en la sangre vs. tumor, p = 0,40 en tejido no involucrado vs. tumor; ganancias: p & lt; 0,0001 en ambos) (Figura 1A). Las tasas de falsos descubrimiento (valores q) de los loci de 256.554 para la sangre, el tejido no involucrado, tumores (en total, según el estadio clínico o por histología) se muestran en la Figura S1. Había CNA sustanciales en los cromosomas 3, 5 y 8, ilustrado en las Figuras S3, S4, y S5. Debido a que se seleccionaron sondas GeneChip Affymetrix 250K Nsp azar en todo el genoma, es razonable suponer que el número de las sondas que detectan alteraciones en el número de copias es proporcional a la duración de genómica de eventos CNA. El número medio de sondas que detectan aumentos del número de copias era 718 en sangre y tejido no involucrado, que era mucho más bajo que el 19469 en tumor (p & lt; 2,20 × 10
-16) (Figura 2A). El patrón también se encontró en las pérdidas de número de copias (950 vs. 2586, p = 0,0029) (Figura 2B). Por otra parte, hay más ganancias que pérdidas número de copias del número de copias en los tumores (p & lt; 2.20 × 10
-16), lo que sugiere que las pérdidas de número de copias son más perjudiciales [11]

A, B. , condes de las sondas total (PT) donde los acontecimientos CNA se producen se representaron para la sangre y no tejido implicado, total del tumor, tumor en estadio temprano, tumor en estadio tardío, adenocarcinoma de estadio temprano (a: pérdidas de número de copias: número de copias de las ganancias, B) (ACA) y el carcinoma de células escamosas etapa temprana (SCC). C, D, condes de las sondas dentro de los genes (GP) en el que los acontecimientos CNA se detectaron en los mismos seis subgrupos (C: pérdidas de número de copias: ganancias de número de copias, D). E, F, media y su intervalo de confianza del 95% de los coeficientes de G /T en los seis subgrupos de ganancias de número de copias (E) y las pérdidas (F); y las líneas discontinuas representan la relación G /T nula en el chip (104.256 /256.554 = 40,64%). No tumorales: sangre (n = 63) y el tejido no involucrado (n = 50); Todo el tumor: el total de 301 tumores de NSCLC; A principios del tumor: Los tumores en estadio I y II NSCLC (n = 246); Late tumorales: tumores en estadio III y IV NSCLC (n = 25); ACA temprana: los tumores en estadio de adenocarcinoma primeros (n = 208); SCC temprana: los tumores en etapa de carcinoma de células escamosas primeros (n = 93) guía empresas
La prevalencia de eventos CNA entre los pacientes con CPNM se asoció con el estadio clínico, especialmente en la amplificación.. La proporción de pacientes con alteraciones del número de copias del tumor en etapa tardía era más del doble de eso en etapa temprana. (Figura 1B) entre los dos grupos, se realizó las pruebas globales para la diferencia emparejada de la proporción de CNA para cada locus en todo el genoma, y ​​mostró una diferencia altamente significativa en las ganancias (& lt; 0,0001) y una diferencia marginalmente significativa en las pérdidas ( p = 0,046) después de la contabilidad para comparaciones múltiples. Del mismo modo, el número medio de sondas que detectan aumentos del número de copias era 14.029 en etapa temprana y 45.792 en la etapa tardía (p = 4,94 × 10
-14) (Figura 2A). Para las pérdidas de número de copias, eran 2.419 y 4.395, respectivamente (p = 0,076) (Figura 2B). Excluyendo aquellos con quimioterapia adyuvante o la radioterapia aún se conserva la tendencia significativa y los números correspondientes (valor p) fueron 8,501 y 41,608 (p = 5,43 × 10
-5) en ganancias y 2,099 y 5,947 (p = 0,017) . Adenocarcinoma y carcinoma de células escamosas subtipos muestran una diferencia significativa en las pruebas de emparejado proporción (Figura 1C y 1D) (p = 0,016 en ganancias y p = 0,027 en pérdidas), pero ninguna diferencia en eventos totales CNA (Figura 2A y 2B) (p = 0,44 en ganancias y p = 0,29 en pérdidas), lo que indica que las CNA en todo el genoma de los patrones de los dos tipos de células pueden ser diferentes a pesar de que el número de eventos totales son similares.

CNA selección de la localización de genes y la enfermedad desarrollo

Mediante el cálculo de la relación G /T (ver Materiales y Métodos), se determinó la selección de CNA con respecto a ubicaciones de genes durante el desarrollo del cáncer. En sangre u otros tejidos no implicados, las relaciones de G /T fueron más bajas que la hipótesis nula (40,64%) en ganancias (31,71%, p = 0,00098) y las pérdidas (30.38%, p = 0,0014) (Figura 2E y 2F), que indica que los acontecimientos CNA son más probable que ocurra genes externos en la línea germinal como un resultado de la selección natural. En el genoma del tumor, el efecto de selección sigue existiendo a pesar de que se ha relajado en cierta medida. Es decir, las relaciones de G /T en los tumores fueron significativamente más altos que los de la línea germinal (p = 3,28 × 10
-5 en ganancias, p = 0,015 en pérdidas), pero seguían siendo significativamente inferior a la tasa nula (39.16 %, p = 0,0068 en ganancias; 37,17%, p = 0,0052 en pérdidas). Sin embargo, un efecto de este tipo de selección no se observó en tumores en fase tardía, es decir, eventos CNA tienen una probabilidad similar a ocurrir dentro de y fuera de genes.

CNA en oncogenes y genes supresores de tumores

104 256 ( 40,64%) de 256,554 sondas de cromosomas somáticos en el chip fueron asignadas a 11.700 genes con 2 kb de extensión, tanto aguas arriba como aguas abajo para incluir el promotor y las regiones flanqueantes. Había 32 oncogenes conocidos en los que & gt; 10% de los pacientes tenían aumentos del número de copias (Tabla 1) y 16 genes supresores de tumores en los que & gt; 1% de los pacientes tuvieron pérdidas número de copias (Tabla 2). También se identificaron 45 genes (incluidos los oncogenes y los no-oncogenes) con & gt; 35% (p≤1.50 × 10
-42) que tiene amplificaciones número de copias (Tabla S2) y 9 genes (
CSMD1
,
SGCZ
,
PDZRN3
,
Nisch
,
CACNA2D3
,
UBE2E2
,
MCPH1
,
PHF7
y
DOCK5
) con & gt; 10% (p≤1.53 × 10
-21) que tiene deleciones número de copias


conjuntos de genes. enriquecida con los genes CNA

Dado que los genes con CNA estaban bajo selección, la hipótesis de que estos genes deben estar involucrados en las funciones biológicas similares, las cuales posteriormente favorecen la aptitud de las células durante la tumorigénesis y /o proliferación de células cancerosas. Por lo tanto, se investigó más a fondo si los genes con CNA fueron enriquecidos en 1619 conjuntos de genes predefinidos. Para evitar resultados falsos positivos cuando se prueba 1619 conjuntos de genes, los análisis se realizaron con un proceso de descubrimiento y validación. En el conjunto de descubrimiento, los genes con el número de copias amplificaciones fueron significativamente enriquecido en 152 conjuntos de genes (p & lt; 0,05); 119 de ellos fueron validados en el conjunto de validación a nivel de significación de 0,05. Para borrado el número de copias, 109 conjuntos de genes se encuentran en el conjunto de descubrimiento (p & lt; 0,05) y 52 fueron validados. También investigamos los 119 y 52 conjuntos de genes validados en etapa temprana y tumores en etapas avanzadas y sólo aquellos enriquecido significativamente en ambos subgrupos se informan (89 en ganancias y 27 en las pérdidas; Tablas S3 y S4) Presentamos 26 conjuntos de genes con especial relevancia para la biología del tumor que tiene el enriquecimiento del número de copias de las ganancias o pérdidas en nuestras muestras en las tablas 3 y 4 y las correspondientes parcelas de enriquecimiento conjunto de genes en las figuras S6 y S7. investigar más a fondo el enriquecimiento conjunto de genes en el tejido pulmonar de la sangre y no involucrarse, encontramos muchos de los 89 y los 27 conjuntos de genes validados también fueron enriquecidos en el genoma de tejido no involucrado pulmón, incluyendo las ganancias de la proteína G vía de señalización,
EDG1
vía, vía celular y las pérdidas en las regulaciones de la autofagia y el ciclo celular mitótico migración mediada por integrinas. (Tablas S3 y S4)

Discusión

El patrón CNA en todo el genoma de nuestros análisis es similar a los publicados en la literatura anterior [2], [3], [12]. Muchos de los oncogenes con amplificaciones número de copias divulgados aquí también es consistente con estudios anteriores [13], [14], [15], [16]. La principal fortaleza de este estudio es su gran tamaño de la muestra, la disponibilidad de pares de sangre y muestras de tejidos no implicados y la información clínica /demográfica detallada, el proceso de descubrimiento y validación de los análisis estadísticos novedosos. La prueba global propuesta para la CNA en todo el genoma nos proporciona la oportunidad de probar la diferencia CNA, tomando al mismo tiempo los lugares del genoma, la correlación del número de copias y las comparaciones múltiples en cuenta. El GSEA personalizado de CNA, por el contrario, puede servir como una herramienta útil para analizar los números de copias en todo el genoma en el contexto funcional y biológica, la vinculación de los datos sofisticados CNA al conocimiento de las categorías de genes, procesos biológicos y estudios previos. Todavía hay limitaciones en nuestro estudio. En primer lugar, la sangre y muestras de tejido no implicadas se pueden obtener de solamente subconjunto de los 301 pacientes. En segundo lugar, no somos capaces de recoger los datos CNA de sujetos normales o pacientes sin cáncer de pulmón, que nos pueden proporcionar una mejor comprensión de cómo el perfil CNA en todo el genoma en pacientes con CPNM se diferencia de la de los sujetos normales o pacientes que no tienen cáncer. En tercer lugar, aunque el gen establece análisis pueden servir para formular hipótesis biológicas, más investigación para estudiar las funciones de los conjuntos de genes /vías con CNA en la tumorigénesis se requiere.

Los materiales de ADN analizadas en este estudio todos vienen de NSCLC los pacientes, por lo que el genoma de la sangre y el tejido no involucrado no puede ser vista como un genoma normal. Utilizamos los ADN de la sangre, el tejido pulmonar no involucrados, tumores en fase inicial y de la última etapa del tumor para representar las etapas secuenciales del desarrollo y progresión del cáncer. Descubrimos que las alteraciones del número de copias aumentan con el desarrollo del cáncer, pero que la selección con respecto a la localización de genes disminuye. Es decir, hay un aumento monotónico en el número de copias alteraciones de la sangre y el tejido de pulmón no involucrado, a primera etapa y luego a los tumores en fase tardía. (Figuras 2A y 2B) Por otra parte, copia cambios de número de tienden a ocurrir
distancia
de localización de genes en la sangre o tejido no involucrado, pero esta tendencia disminuye en los tumores, especialmente en la etapa tardía. (Figuras 2E y 2F) El aumento de CNA refleja la acumulación del número de copias somática cambios debido a la inestabilidad genómica, en la que el estrés hipóxico celular en el cáncer podría desempeñar un papel clave a través de la perturbación de la replicación del ADN y la replicación de segmentos de ADN no contiguas [17 ], [18].

del mismo modo, esperamos ver la acumulación del número de conjuntos de genes afectados por CNA a partir de sangre, tejido no involucrado y luego a un tumor, en lugar de la aparición brusca de tumor. Fuera de nuestras reportados 89 conjuntos de genes de las ganancias de número de copias, el número de conjuntos de genes importantes son 7 en la sangre, 46 en tejido no involucrado, 89 en los tumores. (Tabla S3) Fuera de los 27 reportados conjuntos de genes de pérdidas número de copias, los números son 2 en la sangre, 8 en tejido no involucrado, 27 en los tumores. (Tabla S4)

La selección del CNA con respecto a la localización de genes durante la evolución también se informó en
Drosophila
[11]. Aquí se muestra un efecto de selección similar en el genoma del tumor a pesar de que es relajado en cierta medida. Nuestra hipótesis es que la selección en el tumor se produce durante el desarrollo temprano del cáncer en la parte superior de la consecuencia de la selección evolutiva como se refleja en la línea germinal. Estos resultados ilustran que la purificación de selección que ocurre en la línea germinal como resultado de la evolución de las especies también puede ocurrir en tumor como un efecto de selección durante la oncogénesis y la progresión del tumor. También la hipótesis de que las vías biológicas con CNA que observamos en los cuadros S3 y S4 son la consecuencia de tal selección. Es decir, las alteraciones a gran escala pueden caer muchas gen diferente y vías biológicas al azar, pero sólo las células que adquieren la ventaja de crecimiento a través de la CNA (por ejemplo, amplificada vía de señalización de oncogenes o vía gen supresor de tumores suprimido) sobrevivirán y llegar a ser dominante. El hallazgo de que CNA tienden a ocurrir lejos del gen también refleja la no aleatoriedad de CNA ocurrencia.

Oncogenes pueden imitar el crecimiento normal de señalización de tal manera que la célula de cáncer reduce la dependencia de la estimulación del crecimiento exógeno. Por lo tanto, la amplificación de oncogenes es un paso esencial en la tumorigénesis. oncogenes en el cáncer de pulmón,
KRAS
,
MYC
,
EGFR
, y
ERBB
familia son bien conocidos [19], [20], [21], [22], y todas ellas resultaron ser altamente significativo en las ganancias de número de copias. Por otra parte, los genes con amplificaciones número de copias también fueron representados en exceso de los oncogenes como una categoría definida por el censo de los genes del cáncer humano [23]. Este hallazgo sugiere que la oncogénesis también puede resultar de diferentes conjuntos de oncogenes además de los anteriormente bien conocidos.

también se encuentran genes con CNA en NSCLC estar altamente asociada con genes implicados en otros tipos de cáncer, incluyendo el hígado , mama, riñón y páncreas. Encontramos que los genes con las ganancias de número de copias en NSCLC son más propensos a ser los genes altamente expresados ​​en hepatitis carcinoma hepatocelular relacionado C-[24] (p = 0,00005) y el carcinoma de células renales [25], [26] (p = 0,020) . Los genes con amplificaciones número de copias también se enriquecen de manera significativa en los genes de la firma pobre pronóstico del cáncer de mama [27] (p & lt; 0,00005), lo que puede explicar el peor pronóstico del cáncer de pulmón que de cáncer de mama. Además, nuestro análisis mostró los genes con las ganancias de número de copias en el pulmón fueron enriquecidos en los genes en los cromosomas 7 y 8, que se muestra para tener expresión impulsado por el número de copias en el adenocarcinoma de páncreas [28] (p = 0,0033 y & lt; 0,00005, respectivamente) , y aquellos con pérdidas número de copias fueron enriquecidos en los genes con CNA en el cromosoma 9, también asociado con la expresión de genes en el tumor de páncreas (p & lt; 0,00005). Esto sugiere que la dosis de genes, por así decirlo, de los genes con CNA en NSCLC puede también estar relacionada positivamente con el nivel de expresión. Estos resultados también sugieren que las células de cáncer que surgen de diferentes orígenes tisulares comparten maquinaria similar para la oncogénesis y la invasión tumoral

Nuestro análisis conjunto de genes sugiere que las células pueden adquirir las capacidades comunes de tumor [7] a través de CNA:. Ganancias en oncogenes (autosuficiencia en las señales de crecimiento; evadir la apoptosis), las ganancias en
La calpaína
vía (falta de sensibilidad a las señales anti-crecimiento, invasión de tejidos y metástasis, la angiogénesis sostenida), las ganancias en
EDG1
vía ( evadir la apoptosis y la autosuficiencia en las señales de crecimiento), las ganancias en
ERBB
ha de señalización (autosuficiencia en las señales de crecimiento), las ganancias en
WNT
señalización (autosuficiencia en las señales de crecimiento), las pérdidas en la regulación de la autofagia (evasión de la apoptosis), las ganancias en la telomerasa transcriptasa inversa (

de tERT) (potencial de replicación ilimitado), y las pérdidas en las uniones estrechas y adhesiones celulares (invasión de tejidos y metástasis). Estos resultados proporcionan evidencia de apoyo de la teoría cromosómica de cáncer "[5], [6]: el cáncer es una enfermedad causada por la aneuploidía o alteraciones a gran escala del cromosoma. Se debe a que es más probable que altere el número de copias de un número significativo de genes en numerosos procesos biológicos la duplicación o eliminación a gran escala. Sin embargo, nuestros resultados no están de acuerdo con la noción de que la duplicación /deleción de un gen jugar un papel crítico en el desarrollo del cáncer. La ocurrencia de aneuploidía o a gran escala alteraciones requiere un entorno con la inestabilidad del genoma, que es probable que se facilitó por la duplicación /deleción o mutación de genes críticos en la reparación del ADN, la recombinación y la duplicación. Por lo tanto, no excluyen la posibilidad de que CNA puede ser iniciada por juegos individuales o pequeños de los genes mutados y requieren una mayor investigación
.
El hallazgo de que la CNA se producen preferentemente en ciertas regiones y los cromosomas de armas (es decir,

Enfermedades de sentido común

Enfermedad del corazón | Enfermedades artículos | Enfermedad pulmonar | las preguntas más frecuentes de salud | Salud mental | Diabetes | El sentido común de la Salud | Enfermedades comunes | senior Health | Primeros auxilios
Derechos de autor © Crónica enfermedad[www.enfermedad.cc]