Crónica enfermedad > Cáncer > artículos del cáncer > PLOS ONE: Next-Generation Sequencing de ARN y ADN aislado de emparejado fresco congelado y fijas con formalina muestras incluidas en parafina de cáncer humano y el tejido normal

PLOS ONE: Next-Generation Sequencing de ARN y ADN aislado de emparejado fresco congelado y fijas con formalina muestras incluidas en parafina de cáncer humano y el tejido normal


Extracto

fijado en formol (FFPE) los tejidos incluidos en parafina son un recurso muy valioso para la investigación clínica. Sin embargo, los ácidos nucleicos extraídos de tejidos FFPE están fragmentados y modificar químicamente haciendo que desafiando a utilizar en los estudios moleculares. Se analizaron 23 fresco congelado (FF), 35 FFPE y 38 pares de muestras FF /FFPE, lo que representa seis tipos diferentes de tejidos humanos (vejiga, próstata y carcinoma de colon, el hígado y el tejido normal de colon; amígdalas reactiva) con el fin de examinar el uso potencial de muestras FFPE en la secuenciación de próxima generación (NGS) a base de estudios clínicos retrospectivos y prospectivos. Dos métodos para ADN y tres métodos para la extracción de RNA a partir de tejidos FFPE se compararon y se encontraron a afectar a la cantidad de ácido nucleico y la calidad. ADN y ARN a partir de FFPE seleccionado y especímenes FF /FFPE emparejados se usaron para exoma y el análisis del transcriptoma. Preparaciones de ADN bibliotecas Exoma-Seq fue más difícil (29,5% de éxito) que el de las bibliotecas de ARN-Seq, presumiblemente a causa de las modificaciones de ADN derivado de tejido FFPE. Bibliotecas aún podrían prepararse a partir de ARN aislado de dos décadas de edad tejidos FFPE. Los datos fueron analizados utilizando el CLC Genómica Bio Workbench y revelaron diferencias sistemáticas entre FF y bibliotecas de ácidos nucleicos derivadas de tejido FFPE. A pesar de esto, el análisis por pares de ADN de datos Exoma-cortas mostraron concordancia para el 70-80% de las variantes en FF y FFPE muestras almacenadas durante menos de tres años. datos de RNA-Seq mostraron una alta correlación de los perfiles de expresión en pares FF /FFPE (Pearson correlaciones de 0,90 +/- 0,05), independientemente del tiempo de almacenamiento (hasta 244 meses) y tipo de tejido. Un conjunto común de 1.494 genes se identificó con los perfiles de expresión que fueron significativamente diferentes entre las muestras pareadas FF y FFPE independientemente del tipo de tejido. Nuestros resultados son prometedores y sugieren que NGS puede ser utilizado para estudiar muestras FFPE en ambos estudios prospectivos y retrospectivos basados ​​en archivo en el que los especímenes FF no están disponibles

Visto:. Hedegaard, J, K Thorsen, Lund MK, Hein A-MK, Hamilton-Dutoit SJ, Vang S, et al. (2014) La secuenciación de próxima generación de ARN y ADN aislado de emparejado fresco congelado y fijas con formalina muestras incluidas en parafina de cáncer humano y el tejido normal. PLoS ONE 9 (5): e98187. doi: 10.1371 /journal.pone.0098187

Editor: Zhuang Zuo, UT MD Anderson Cancer Center, Estados Unidos de América

Recibido: 14 de marzo de 2014; Aceptado: April 10, 2014; Publicado: 30 de mayo de 2014

Derechos de Autor © 2014 Hedegaard et al. Este es un artículo de acceso abierto distribuido bajo los términos de la licencia Creative Commons Attribution License, que permite el uso ilimitado, distribución y reproducción en cualquier medio, siempre que el autor original y la fuente se acreditan

Disponibilidad de datos:. La autores confirman que todos los datos que se basan los resultados son totalmente disponible sin restricciones. El acceso a los datos de la secuencia, que contienen información de identificación persona, necesita la firma de un formulario de acceso controlado, y se puede acceder en el Europeo del Genoma-fenoma Archivo [25] utilizando el ID del estudio EGAS00001000737 siguiente petición al Comité de Acceso a datos MOMA. matrices de expresión están disponibles sin restricciones a través de ArrayExpress [REF: www.ebi.ac.uk/arrayexpress] en virtud de la adhesión:.-E-2523 MTAB

Financiación: Este trabajo fue apoyado por becas de The Danish Nacional de Tecnología Avanzada Fundación (http://hoejteknologifonden.dk/), La Fundación John y Birthe Meyer y la Sociedad danesa del cáncer (http://www.cancer.dk/). Los donantes no tenía papel en el diseño del estudio, la recogida y análisis de datos, decisión a publicar, o la preparación del manuscrito

Conflicto de intereses:. Anne-Mette K. Hein y Bjarne Knudsen son empleados por CLC bio, que es una empresa QIAGEN. Mette Katrine Lund y Mogens Kruhøffer son empleados por AROS Biotecnología Aplicada. Esto no altera la adhesión de los autores a todas las políticas de PLoS ONE en los datos y materiales de uso compartido.

Introducción

Fijado en formol (FFPE) muestras de tejido incluido en parafina almacenados en los archivos de patología de diagnóstico representan un banco biológico de gran valor para la investigación clínica retrospectiva. Además, las muestras FFPE pueden ser útiles en estudios prospectivos omitiendo la recogida de muestras (FF) fresco congelado. Desafortunadamente, los ácidos nucleicos son más difíciles de extraer a partir de tejido FFPE debido a la necesidad de eliminar la parafina y para contrarrestar las interacciones proteína-ADN covalentes que resultan del proceso de fijación. Además, el retraso de fijación (es decir, tiempo de isquemia perioperatoria), el proceso de fijación, la preparación del tejido, la inclusión en parafina, y el almacenamiento de archivos contribuyen a la fragmentación, la reticulación y la modificación química de los ácidos nucleicos derivadas de tejido FFPE. Estos cambios interfieren con muchos análisis molecular clásica que requieren ácidos nucleicos de alta calidad. Los avances en la secuenciación de próxima generación (NGS) tecnologías permiten la investigación de los genomas, epigenomas y transcriptomes utilizando material de muestra limitado. Por otra parte, este análisis se puede hacer a un costo relativamente modesto, teniendo en cuenta el aumento masivo de la cantidad de información que se puede obtener. El poder de NGS analizar en profundidad un gran número de secuencias cortas potencialmente la convierte en una tecnología ideal para aplicar a los ácidos nucleicos generalmente fragmentados que pueden extraerse a partir de muestras FFPE. El desarrollo de métodos fiables basados ​​en NGS para su uso con ácidos nucleicos derivadas de tejido FFPE de baja calidad abriría los archivos de patología de diagnóstico para perfiles de alto rendimiento, lo que facilita amplios estudios clínicos retrospectivos. Del mismo modo, la capacidad de utilizar muestras de FFPE para el análisis molecular en estudios prospectivos sería de gran beneficio, reduciendo potencialmente, o incluso eliminar la necesidad de la recogida y almacenamiento de muestras clínicas criopreservados tedioso.

mientras que los ácidos nucleicos aislados de ahora tejidos FFPE han estudiado principalmente sido previamente usando PCR y los métodos basados ​​en microarrays, hay informes sobre la aplicación de NGS al material FFPE. Uno de los primeros vinieron de Schweiger
et al.
Que informó de análisis basado en NGS de ADN (ADN-Sec) aislado de muestras de FFPE [1]. Los autores encontraron una buena correlación entre FF emparejado y muestras de cáncer de mama FFPE de un único paciente en el análisis de las alteraciones del número de copias en todo el genoma y las frecuencias de las variantes basadas en la cobertura bajo la secuenciación del genoma [1]. Posteriormente, la madera
et al.
Agrupación combinada de las muestras y la reducción en la cantidad de ADN de entrada para estudiar las alteraciones del número de copias en todo el genoma en muestras FFPE [2]. Otro documento del grupo de Schweiger mostró que los estudios de las variaciones genómicas basados ​​en la secuenciación de ADN a partir de tejido FFPE beneficiado del aumento de la cobertura obtenidos mediante resecuenciación dirigida, lo que reduce el impacto del ruido de la fijación inducida [3]. Recientemente, Tuononen
et al.
Aplica resecuenciación ADN dirigido a la pantalla FFPE no pequeñas carcinomas de pulmón de células clínicamente importante para
EGFR
,
KRAS
y
BRAF
mutaciones y se encontró una correlación significativa con los resultados de los análisis basados ​​en la PCR en tiempo real se realizan en paralelo [4]. Spencer
et al.
Aplica resecuenciación dirigida de genes relacionados con el cáncer de 27 a 16 FF /FFPE emparejados adenocarcinomas de pulmón y encontraron que, a pesar de los efectos demostrables del proceso de fijación, las variantes de un solo nucleótido idénticas se pudieron detectar de forma fiable [ ,,,0],5]. Fanelli
et al.
Han informado de un método de secuenciación de alto rendimiento para los perfiles epigenéticos basado en el chip-ss, muestras FFPE de un modelo de leucemia de ratón y de una gama limitada de los cánceres humanos (un seminoma y seis carcinomas de mama) , que permiten el análisis de modificaciones de las histonas y los factores de transcripción de unión en un genoma de gran escala [6], [7]. Gu
et al.
[8], [9] mostró que la baja de entrada asciende ADN derivado de tejido FFPE podría ser utilizado junto con una representación reducida de secuenciación de bisulfito (RRB) para permitir que los estudios de perfiles de metilación del ADN en el genoma de toda muestras clínicas de archivo.

Weng
et al.
fueron uno de los primeros en describir el análisis basado en NGS de ARN (RNA-Seq) aislado de muestras de FFPE [10]. Estos autores informaron resultados comparables de expresión de secuenciación profunda de miRNAs derivados de FF sincronizado y FFPE carcinomas de células renales. Además, encontraron una alta correlación comparar los resultados de NGS con los obtenidos en el uso de microarrays paralelo y metodologías de RT-PCR. Recientemente, Meng
et al.
Informó la aplicación exitosa de la secuenciación de los genes miARN basada en la ligadura de las muestras de cáncer almacenados hasta 9 años [11]. Mientras que se sabe de los estudios que utilizan técnicas moleculares tradicionales que las moléculas de ARN más pequeñas, como miARN son más capaces de soportar la fijación con formalina [12], hay una expectativa general de que las moléculas de ARN más largas son probable que sea más susceptible a la fragmentación y modificaciones, lo que hace ellos plantillas pobres para la RNA-Seq. Un estudio basado en la NGS de moléculas de ARN más largos ha sido reportado por Sinicropi
et al.
Quien encontró que los datos de RNA-Seq derivados de los cánceres de mama FFPE primaria era de calidad suficiente para permitir el descubrimiento de biomarcadores [13]. Adiconis
et al.
Informó de un análisis comparativo de cinco métodos para RNA-Seq aplica a ARN de baja calidad (por ejemplo, que aislado de tejido FFPE) y baja la cantidad de ARN [14]. Recientemente, Norton
et al.
Aplica RNA-Seq a nueve conjuntos de muestras de tumores de mama FFPE FF y almacenados durante un máximo de cuatro años y se encontró una buena correlación entre los FF y FFPE perfiles de expresión pareados [15].

Estamos ampliando en estos estudios en cuanto a la cantidad y diversidad de especímenes humanos investigados y los informes de un análisis sistemático de la posible utilización de perfiles basados ​​en NGS de muestras FFPE humanos en estudios clínicos retrospectivos y prospectivos. Nuestro estudio incluye (1) la evaluación de diferentes estrategias de aislamiento de ácidos nucleicos a partir de muestras FFPE humanos y FF a juego y las muestras FFPE; (2) la preparación del genoma dirigida (ADN Exoma-Sec) y transcriptoma conjunto (RNA-Seq) bibliotecas de secuenciación; y (3) el análisis exhaustivo de los datos NGS obtenido. Los objetivos primarios fueron identificar y caracterizar los efectos sistemáticos del proceso de fijación de los resultados obtenidos, así como los parámetros críticos en el flujo de trabajo de la cirugía a los datos analizados NGS. kits de extracción disponibles se evaluaron con respecto a la purificación de ARN y ADN a partir de muestras humanas FFPE seleccionados (hígado normal, carcinoma de hígado, amígdalas reactiva, carcinoma de pulmón, carcinoma de mama, piel normal de mama, y ​​carcinoma de vejiga; a juego con muestras FF desde el hígado y las muestras de amígdalas). Esto fue seguido por la evaluación de la extracción de ARN y ADN a partir de muestras humanas FFPE (carcinoma colorrectal, hígado normal, carcinoma de vejiga, y amígdala) con diferentes tiempos de almacenamiento de archivos de rutina (hasta 244 meses). Por último, el ADN y el ARN se extrajeron de FF a juego y muestras humanas FFPE (vejiga, de próstata y carcinomas de colon, así como a partir de tejido de colon normal). El ADN extraído y el ARN se utilizaron para la preparación de genoma dirigida (ADN Exoma-Seq) y transcriptoma conjunto (RNA-Seq) bibliotecas de secuenciación y datos NGS obtenido se analizó, centrándose en el descubrimiento de los efectos sistemáticos del proceso de fijación.

Métodos y Materiales

declaraciones Ética

Todos los experimentos en este estudio se llevaron a cabo en muestras de origen humano seleccionados de los bancos de datos genéticos de tejido congelado en el hospital de la Universidad de Aarhus, Dinamarca y desde el bloque FFPE de diagnóstico archivo del Instituto de Patología, hospital de la Universidad de Aarhus, Dinamarca. Los tejidos fueron retirados en el curso de procedimientos quirúrgicos de rutina y eran excedente para las necesidades de diagnóstico. Las muestras fueron anónimos antes de su uso en este estudio. El estudio fue aprobado por el Comité de Ética de la Investigación de la Salud de la Región Central de Dinamarca y la Agencia de Protección de Datos de Dinamarca.

Las muestras clínicas y objetivos principales

flujos de trabajo de estudio desde la cirugía a fin de cuentas de la NGS los datos se ilustran en la Figura S1 junto con los parámetros clave investigados. Se seleccionaron las muestras para maximizar la gama de variables (por ejemplo, el tiempo de almacenamiento desde la recolección y tipo de tejido) con un impacto esperado en los resultados. Los conjuntos de muestras se describen en esta sección, en la Tabla 1 y en la Tabla S1. En el estudio participaron un total de 23 FF, 35 y 38 muestras FFPE FF /FFPE pareadas, que representan seis tipos diferentes de tejidos humanos (vejiga, próstata y carcinoma de colon, el hígado y el tejido normal de colon; amígdalas reactiva). Un total de 16 FF y FFPE especímenes de diferentes tejidos fueron seleccionados para la prueba inicial de ADN y ARN purificación (
set of the test). Para estudiar el impacto del tipo de tejido y el tiempo de almacenamiento después de la fijación, se seleccionaron cuatro cuadras de FFPE tejidos (colorrectal y el carcinoma de vejiga, y normal del hígado y de la amígdala), cada uno con cuatro tiempos de almacenamiento (2-3, 13-15, 60-62 y 241-244 meses). Este experimento se denota
set of the FFPE tiempo de almacenamiento. El experimento más grande,
el colon FF /FFPE emparejado establecer
, incluyó 19 muestras pareadas FF /FFPE tumor colorrectal (benignos y malignos) y 13 FF muestras de tejido de colon normal a juego que se habían recogido 2 - 13 años previamente. Para probar la detección de variantes específicas de nucleótido único, un conjunto de 11 muestras de colon fueron seleccionados con variantes conocidas en
KRAS
y
BRAF gratis (
el KRAS de colon /BRAF variantes establece la detección
). Por otra parte, siete pares de muestras de carcinoma de próstata FF /FFPE recogieron 2 - 11 años antes (
set of the emparejado de próstata FF /FFPE), ocho pares de muestras de carcinoma de vejiga FF /FFPE recogieron 5 - 9 años antes (
la vejiga emparejado FF /FFPE establecen
) y las muestras de carcinoma de vejiga 10 FF (
la conservación de la firma FF vejiga establecer
) fueron seleccionados para el estudio. ADN y ARN se aislaron de cada muestra y se utilizan para generar las bibliotecas para la secuenciación y la secuenciación del exoma-RNA total. El principal objetivo de los experimentos de ADN Exoma-Seq fue comparar la detección de la variación genómica en muestras de FFPE FF y coincidentes, que incluyen tanto variantes específicas de relevancia clínica, así como variaciones globales. Se llevaron a cabo los experimentos de RNA-Seq para permitir que se hagan comparaciones de la información obtenida a partir de la transcripción muestras FFPE FF y coincidentes, incluyendo (1) la información global en la actividad transcripcional; (2) los niveles de expresión específicos en relación con el estado biológico (es decir, contrastando las muestras benignas y malignas en
establezca el emparejado de colon FF /FFPE
); y (3) la descripción de un patrón de expresión para la progresión del tumor de vejiga (en
la firma FF vejiga conjunto conservación
y
establezca la vejiga emparejado FF /FFPE
).

purificación de ADN y el ARN de FF y el tejido FFPE

Para identificar los métodos de extracción que resultan en la calidad óptima de ácidos nucleicos y el rendimiento, ARN y ADN fueron purificados de los bloques FFPE de la prueba
establecidos
(Tabla 1 y la Tabla S1) utilizando kits disponibles en el mercado como se describe a continuación. Hasta seis 10 micras se cortaron secciones de cada bloque de tumor y se colocaron en tubos de 1,5 ml de centrífuga estériles listos para la extracción. Tubos que contienen secciones de corte FFPE para la purificación de ARN se almacenaron a -80 ° C hasta su uso. ADN y ARN purificaciones de las muestras de hígado y de la amígdala FF coincidente se realizaron utilizando un robot QIAsymphony en combinación con el kit QIAsymphony DSP DNA Mini y QIAsymphony RNA Mini Kit (ambos de Qiagen). ADN se purificó a partir de muestras FFPE utilizando QIAamp DNA FFPE Tissue (QIAGEN) y kits de ADN FFPE Nucleospin (Machery-Nagel); El ARN se purificó a partir de muestras FFPE utilizando miRNeasy FFPE (QIAGEN), Nucleospin FFPE RNA (Machery-Nagel) y Expressart FFPE RNAready (Amp Tec) kits. Con el fin de probar la purificación en paralelo de ARN y ADN a partir de las mismas secciones FFPE, se incluyeron el kit Nucleospin FFPE RNA /DNA (Machery-Nagel) y el Kit de Aislamiento RecoverAll total de ácido nucleico para FFPE (Ambion). Por último, con el fin de probar los procedimientos de purificación automatizados, ADN y ARN se purificaron en un robot QIAsymphony usando programas especializados FFPE y el kit QIAsymphony DSP DNA Mini y QIAsymphony RNA Mini Kit (Qiagen), respectivamente. Todas las extracciones se realizaron por triplicado, cada uno en tres secciones FFPE. Debido a una cantidad limitación del material, la extracción de muestras de mama Con Recuperar Todo se hizo en sólo duplicados. Las purificaciones se llevaron a cabo siguiendo los protocolos del fabricante con la siguiente modificación: Deparaffinisation antes de la extracción de ADN y el ARN utilizando el QIAamp DNA FFPE y kit Expressart FFPE RNAready, respectivamente, se hizo utilizando una solución de Deparaffinisation de QIAGEN en lugar del xileno incluido en los kits. Todas las muestras de ADN se trataron con RNasa y todas las muestras de ARN fueron tratadas con DNasa durante la purificación. Después de la purificación, todas las muestras se lavaron en placas de filtro UF y se eluyeron en tampón de elución de QIAGEN (EB, [10 mM Tris-HCl, pH 8,5]). Los perfiles de fragmentación del ARN purificado y el ADN se estimaron por electroforesis en el chip de una muestra de 1 l en un Agilent 2100 Bioanalyzer (Agilent Technologies). Dado que sólo de doble cadena (ds) de ADN es activo en la formación de la biblioteca TruSeq, tanto la absorbancia total al 260 nM (NanoDropND-1000 espectrofotómetro), así como un ensayo específico dsDNA (Qubit dsDNA BR Assay Kit /Qubit 2,0 fluorómetro, Invitrogen) fue utilizado para cuantificar la concentración de ADN. La concentración de ARN se determinó utilizando sólo la absorbancia total al 260 nM.

Esta purificación inicial fue seguido por el ADN y la extracción de RNA a partir de tejidos FFPE que habían sido almacenados de forma rutinaria en el archivo de patología para distintos períodos de tiempo después de la fijación. Este estudio incluyó cuatro tiempo de almacenamiento: los tejidos de las amígdalas (normal reactiva), hígado (normal no neoplásico), vejiga (carcinoma) y colon (carcinoma). Cada tejido fue representado con cuatro FFPE bloques almacenados por 2-3, 13-15, 60-61 y 241-244 meses, respectivamente (Tabla 1 y Tabla S1). Sólo se utilizaron los dos kits de extracción más prometedores: Las purificaciones de ADN se realizaron utilizando el QIAamp DNA FFPE de tejidos y kits de Ambion RecoverAll. ARN Las purificaciones se realizaron utilizando kits miRNeasy FFPE y AmpTec Expressart. Todas las extracciones se realizaron por duplicado usando tres secciones de tejido.

El estudio tiempo de almacenamiento fue seguida de la purificación de ADN y ARN a partir de muestras pareadas FF /FFPE de cáncer de colon (19 muestras), la vejiga (8 muestras) y de próstata ( 7 muestras) carcinomas (Tabla 1 y Tabla S1). Además, se incluyeron 12 FFPE muestras de carcinoma de colon con mutaciones conocidas en KRAS y BRAF (
el KRAS de colon /BRAF variantes establece
detección, la Tabla 1 y Tabla S1). Todas las extracciones de material de FF se realizaron con el QIAsymphony como se describe anteriormente. ARN fue extraído manualmente de FFPE bloques usando los kits AmpTec Expressart y el ADN se extrajo de forma semiautomática de FFPE bloques en el QIAsymphony. El ARN se extrajo en dos reacciones paralelas; uno tratado con DNasa I y el otro se trató adicionalmente con Exonulcease I que cataliza la eliminación de los nucleótidos de ADN monocatenario (ss).

Preparación y secuenciación de DNA Exoma-Seq bibliotecas

bibliotecas de ADN genómico se prepararon a partir FF y ADN utilizando kits de preparación de la biblioteca de ADN TruSeq (Illumina, siguiendo el protocolo libre de gel) FFPE derivados seguido de enriquecimiento exoma usando kits TruSeq exoma (iluminación). preparación biblioteca de ADNg se realiza de acuerdo con el manual del fabricante con las siguientes modificaciones. (1) Con el fin de evitar tampón efectos, 1,2 g de ADN de doble cadena se procesó utilizando una placa de filtro QIAGEN UF, se lavó dos veces en tampón EB ([10 mM Tris-Cl, pH 8,5], QIAGEN) y se resuspendió en 50 l de tampón EB antes de ser utilizado como entrada para la preparación de la biblioteca TruSeq gDNA. (2) El número de ciclos de PCR utilizados para la amplificación de las bibliotecas de derivados de FFPE se aumentó de 10 a 11. (3) Después de la etapa de talones de purificación final de las bibliotecas de gDNA amplificados, 10 l de tampón EB se añadió a las bibliotecas, con lo el volumen final hasta 40 mL. La distribución del tamaño de las bibliotecas gDNA se estimó por electroforesis en-chip (DNA 1000 chip de ADN) de una muestra de 1 l en un Agilent 2100 Bioanalyzer (Agilent Technologies). La concentración de ADN de las bibliotecas se estimó utilizando el kit de cuantificación de KAPA Biblioteca (Kapa Biosystems). En pocas palabras, la cuantificación se realizó utilizando 10 volúmenes de reacción l que contenía 6 l KAPA reactivo /mezcla de cebadores y 4 l 1.000.000 veces muestra diluida siguiendo el procedimiento recomendado y los estándares suministrados. La cuantificación se llevó a cabo en tres diluciones independientes de cada muestra. Exoma focalización se realizó en grupos de hasta seis bibliotecas gDNA usando 500 ng de cada biblioteca de ADNg de acuerdo con las recomendaciones del fabricante. gDNA bibliotecas preparadas a partir de muestras FFPE FF y no se agruparon. Después de la etapa de talones purificación final de los exoma capturado y amplificado bibliotecas gDNA, 30 l de tampón EB se añadió a las bibliotecas, con lo que el volumen final hasta 60 mL. Las distribuciones de tamaño de las bibliotecas capturados se estimaron por electroforesis en-chip (chip de ADN de alta sensibilidad) de una muestra de 1 l en un Agilent 2100 Bioanalyzer (Agilent Technologies). La concentración de ADN de las bibliotecas se estimó mediante el KAPA Biblioteca kit de cuantificación como se ha descrito anteriormente. El exoma capturado bibliotecas gDNA se combinaron en 2 poblaciones nM agrupado, desnaturalizadas y se diluyeron a 10 pm con tampón de hibridación previamente enfriado y se cargan en TruSeq PE v3 celdas de flujo en una CBot Illumina seguida de la secuenciación de extremo emparejado indexadas (101 + 7 + 101 pb ) en un Illumina HiSeq 2000 mediante TruSeq SBS química Kit v3 (iluminación).

estado mutacional del gen KRAS en BRAF y


KRAS
y
BRAF mutación
el análisis de las 11 muestras en
el KRAS de colon /BRAF variantes conjunto de detección
se realizaron como se describe [16]. En pocas palabras,
KRAS
codón 12, 13 y 61 y
BRAF V600E
y el codón 442 a 474 fueron examinadas usando el Lightscanner (Idaho Technology). Las muestras con divergente curvas de fusión fueron validados mediante secuenciación de Sanger en el analizador genético 3130X (Applied Biosystems)

Preparación y secuenciación de bibliotecas de ARN-Seq

Para permitir un análisis exhaustivo de la RNA-Seq datos, se requiere el método utilizado para la preparación de bibliotecas de ARN-Seq para proporcionar hebra-específica (direccional) y la información de extremo emparejado así como para facilitar la secuenciación del múltiplex. Debido a la degradación esperada del RNA de los tejidos FFPE, el método de preparación de la biblioteca no debe basarse en la selección de poli (A) + ya que esto deterioraría la preparación de la biblioteca o al menos resultado en el sesgo de un 3 '. La obtención de datos total en ARN-Seq facilitaría, además, una visión más completa del transcriptoma. Cuando el estudio se inició en 2011, el único kit comercializado cumplimiento de todos los requisitos era la tecnología Ribo-Zero (Epicentro, una compañía Illumina) para el agotamiento de ARNr seguido de la preparación de la biblioteca usando la tecnología ScriptSeq (Epicentro, una compañía Illumina). Citoplasmática y mitocondrial rRNA fueron retirados de ARN total usando el kit de Oro magnética Ribo-Zero (humano /ratón /rata, Epicentro, una compañía Illumina) siguiendo las instrucciones del fabricante. Brevemente, se añadió rRNA de eliminación de soluciones a 500 ng de ARN total y se incubó durante 10 min a 68 ° C, a continuación 15 min a temperatura ambiente. Sondas con hibridado rRNA se eliminaron mediante la adición de la mezcla de ARN-sonda a perlas magnéticas lavadas seguido por incubación durante 5 min a temperatura ambiente, la mezcla mediante agitación con vórtex, incubación durante 5 min a 50 ° C, la magnetización y la transferencia del sobrenadante a una RNasa tubo de conexión. El rRNA agota ARN se purificó usando Agencourt RNAClean XP Kit (Beckman Coulter Inc., Brea, CA, US). Brevemente, se añadió un volumen de 1,8 veces de AMPure Beads RNAClean XP para el rRNA agota ARN seguido de incubación durante 15 min a temperatura ambiente, dos lavados con etanol 80% y la elución en agua 30 l RNasa libre. La calidad de la rRNA agota RNA se estimó por electroforesis en-chip (picoChip) de una muestra de 1 l en un Agilent 2100 Bioanalyzer (Agilent Technologies). se utilizó Savant Speed-vac (Thermo Fischer Scientific) para reducir el volumen de la muestra restante a 9,5 l, seguido de síntesis de direccional, de extremo emparejado y bibliotecas de ARN-Seq indexadas utilizando el kit ScriptSeq v2 (Epicentre, una compañía Illumina) siguiendo el recomendado procedimiento. Brevemente, rRNA agota RNA era químicamente fragmentada (a menos que se utilizó RNA severamente degradada a partir de tejido FFPE en cuyo caso la fragmentación adicional fue omitida), siguiendo el procedimiento descrito en el apéndice en el manual ScriptSeq y cDNA fue sintetizado a partir de un hexámero aleatorio etiquetado. El ADNc era terminal etiquetado utilizando un extremo 3 'bloqueado y marcado oligo seguido de purificación MiniElute (QIAGEN). Se utilizó el di-etiquetados cDNA como molde para la PCR (10 ciclos de muestras FF, 13 ciclos de muestras FFPE) utilizando la prueba de fallas de PCR Enzyme (Epicentro, una compañía Illumina), un cebador directo y un cebador inverso indexada /código de barras. Las bibliotecas amplificados se purificaron usando Agencourt XP Kit (Beckman Coulter). Brevemente, se añadió un volumen de 1,0x AMPure Beads XP (Beckman Coulter) a cada reacción de PCR seguido de incubación durante 15 min a temperatura ambiente, dos lavados con etanol 80% y la elución en agua 20 l RNasa libre. Las cualidades de las bibliotecas de ARN-Seq se estimaron por electroforesis en-chip (chip de ADN de alta sensibilidad) de una muestra de 1 l en un Agilent 2100 Bioanalyzer (Agilent Technologies). La concentración de ADN de las bibliotecas se estimó utilizando el kit de cuantificación de KAPA Biblioteca (Kapa Biosystems) siguiendo el procedimiento recomendado y los estándares suministrados. Las bibliotecas de ARN-Seq se combinaron en las poblaciones agrupadas 2 nm, desnaturaliza y se diluyeron a 10 pm con tampón de hibridación previamente enfriado y se cargan en TruSeq PE v3 celdas de flujo en una CBot Illumina seguida de la secuenciación de extremo emparejado indexadas (101 + 7 + 101 pb ) en un uso de la química TruSeq SBS Kit v3 Illumina HiSeq 2000 (Illumina).

análisis de secuencias

El flujo de trabajo de análisis se describe en esta sección y gráficamente presenta en la Figura S2. Pareadas archivos desmultiplexadas FASTQ se generaron utilizando el software Casava (iluminación) y el control de calidad inicial se ha realizado mediante FastQC [17] o casava.

pareadas archivos FASTQ desmultiplexadas de bibliotecas de ADN-exoma se importaron en el CLC genómica Workbench (CLC bio, versión 6.0.1) que se ejecuta en CLC genómica servidor (CLC bio, versión 5.0.1). secuencias adaptadoras y bases de baja calidad fueron recortados y lee fueron asignadas a HG19. El duplicado
Eliminar asignada lee
herramienta se utiliza para eliminar emparejado dice que tiene las mismas coordenadas de inicio y fin, y son, por lo tanto, probablemente duplicados de PCR. Las variantes se detectaron en los datos exoma con el CLC Bio Probabilístico variante de llamadas utilizando los siguientes parámetros: cobertura mínima = 10; Variante de probabilidad = 90,0; variantes máxima esperada = 4; Requisito de lecturas en ambas direcciones que apoyan la llamada.

apareadas archivos FASTQ-de multiplexado de las bibliotecas de ARN-Seq fueron recortados por tramos de secuencias adaptadoras, unido en una sola lectura, si es posible, seguido de la calidad de recorte utilizando los comandos del Cell Asamblea CLC (CLC bio, versión 4.012.84829). Esto dio lugar a tres diferentes archivos FASTQ: datos de extremo emparejado, datos de gama única después de unirse de emparejado lee, y los datos de gama única después de la eliminación de uno de los pareados lee debido a, por ejemplo, baja calidad. Los tres tipos de archivos FASTQ fueron importados de forma discontinua en el CLC Genómica Workbench (CLC bio, versión 6.0.1) se ejecuta en un servidor de CLC Genómica (CLC bio, versión 5.0.1) utilizando herramientas de línea de comandos del servidor CLC (CLC bio, versión 1.7.1). La alta calidad importados dice estaban diseñados en las regiones de genes y las transcripciones anotado por REFSEQ NCBI Humano 30 de de octubre de 2012, en dos carreras de la herramienta de RNA-Seq Análisis de CLC Genómica Workbench. La herramienta de ARN-ss se llevó a cabo con el
Uso de referencia con anotaciones
opción. Con esta opción, las lecturas están diseñados en base a las secuencias correspondientes secuencias de transcripción de genes y anotaciones. En la primera carrera, sólo coincide con la cadena directa de los genes fueron aceptadas (con la opción de cadena específica hacia adelante); en la segunda pasada, las lecturas que no se han mapeado en la primera carrera fueron asignadas permitiendo que sólo los partidos a la cadena inversa de los genes (usando la opción de cadena específica con versiones anteriores). Para estimar la contaminación con rRNA, dice que no se asigne la transcriptoma humano según la definición de RefSeq, fueron asignadas capítulo específico de adelante hacia ARNr humana (HSU13369, HSU13369, HSU13369 y NC_012920) y con asignación de las Naciones Unidas lee a continuación, se asigna el capítulo específico de atrás hacia humana rRNA.
Informes Asignación
y
Los informes detallados del mapa
se generaron a partir de cada análisis de ARN-Seq para cada muestra, se exportan desde el CLC Genómica Workbench en formato Microsoft Excel, guardados como archivos de texto delimitados por tabuladores individuales, y los datos específicos se extrajeron y se estudiaron posteriormente. Para cada experimento, las matrices de mapeo de genes a gota de tanto hacia delante como hacia atrás y analiza RNA-Seq contra el transcriptoma humano fueron exportados de la CLC Genómica Workbench como archivos de texto delimitados por tabuladores para la exploración y el análisis estadístico en el entorno de computación R (versión 3.0.1 para Windows [18]). Estas matrices de mapeo de genes en cuanto se resumen los resultados de los mapas de las columnas de valores y recuentos de RPKM lee la cartografía a diferentes regiones, como el gen, el exón, el exón-exón y el exón-intrón. Las matrices de "exón Total de Lecturas" conteos fueron seleccionados de las matrices de mapeo de genes a gota y se analizaron en el paquete R
El análisis empírico de los datos digitales de genes de expresión en R gratis (bordeadora, versión 3.2.3 [19] - [ ,,,0],23]) con la función de escalamiento multidimensional (MDS) para el análisis exploratorio y las diferentes herramientas estadísticas disponibles para la identificación de los genes diferencialmente afectados. El paquete R Hexbin se utilizó para trazar perfiles de expresión basados ​​en ARN-Seq (base en los valores RPKM) por contenedores hexagonales. especificidad Strand se estimó como la fracción de gen Total de Lecturas de mapeo en la dirección hacia delante con respecto al número total de lecturas de asignación en ambas direcciones. se omitieron Genes con menos de 10 lee la cartografía en la dirección hacia adelante. Para estimar la fracción de secuencias duplicadas en la cartografía posterior de los datos de RNA-Seq (hacia adelante), archivos BAM se exporten del CLC Genómica Workbench y analizados utilizando la herramienta MarkDuplicates en herramientas de Picard (Picard-tools-1.47, [24]).

adhesión de datos

Todos los datos subyacentes a los hallazgos descritos en el manuscrito son totalmente disponible sin restricciones. El acceso a los datos de la secuencia, que contienen información de identificación persona, necesita la firma de un formulario de acceso controlado, y se puede acceder en el Europeo del Genoma-fenoma Archivo [25] utilizando el ID del estudio EGAS00001000737 siguiente petición al Comité de Acceso a datos MOMA. matrices de expresión están disponibles sin restricciones a través de ArrayExpress [26] en virtud de la adhesión E-MTAB-2523.

Resultados
estudios clínicos retrospectivos y prospectivos basados ​​en NGS
Hemos estudiado el uso potencial de las muestras FFPE en, centrado en la detección de efectos sistemáticos del proceso de fijación de las llamadas variantes en el ADN-Sec y en los perfiles de expresión de ARN-Seq.

Enfermedades de sentido común

Enfermedad del corazón | Enfermedades artículos | Enfermedad pulmonar | las preguntas más frecuentes de salud | Salud mental | Diabetes | El sentido común de la Salud | Enfermedades comunes | senior Health | Primeros auxilios
Derechos de autor © Crónica enfermedad[www.enfermedad.cc]