Análisis del perfil de expresión génica en células de sangre periférica

El análisis de los perfiles de expresión génica se realizó utilizando microarrays de transcriptoma humano completo con la tecnología de Illumina. Como se ha explicado en el aparatado correspondiente al diseño del estudio, este análisis únicamente se llevó a cabo en la cohorte de pacientes críticos.

El BeadChip Illumina es un método para el análisis de la expresión génica y el análisis de genotipado múltiple. El elemento esencial de la tecnología BeadChip es la unión de los oligonucleótidos en perlas de sílice. Los pasos que se siguieron para evaluar la expresión génica diferencial se muestran en la Figura 1 y se detallan en las siguientes secciones.

Figura 1: Esquema de trabajo para el análisis de expresión génica

clip_image002

1. Extracción del ARN total

La extracción de ARN total se realizó a partir de los tubos PAXgene empleando el equipo “PAXgene blood RNA kit”. El fundamento de este kit se basa en la adsorción y desorción de los ácidos nucleicos en presencia de sales. En condiciones normales, los ácidos nucleicos están recubiertos de una capa hidratante de moléculas de agua que mantienen su solubilidad en soluciones acuosas. Con la adición de sales a los ácidos nucleicos, se destruye esta ordenada estructura de moléculas de agua de la capa hidratante, por lo que las sales crean un entorno hidrofóbico alrededor de los ácidos nucleicos. Bajo estas condiciones hidrofóbicas, al pasar los ácidos nucleicos a través de una columna con membrana de sílice, los ácidos nucleicos se unen perfectamente a ella, mientras que las proteínas, metabolitos y otros contaminantes no se unen y, por lo tanto, son eliminados de la muestra durante los pasos de lavado.

Para eliminar el ADN de la muestra y obtener únicamente ARN purificado se añade DNasa a la muestra. Posteriormente, el ARN se eluye de la membrana de sílice mediante tampones de elución con baja concentración en sales (ligeramente alcalinos) que permiten recuperar la capa hidratante de los ácidos nucleicos, produciendo así la liberación del ARN. Con este proceso de purificación, se obtiene ARN altamente purificado y listo para usar en procesos posteriores (figura 2).

Figura 2: Pasos a seguir para la extracción de ARN con el kit “PAXgene blood RNA kit”.

clip_image004

2. Evaluación de la cantidad y calidad del ARN total

Para obtener resultados reproducibles y comparables en el análisis de expresión génica, es necesario utilizar una cantidad fija de ARN en todos los experimentos. Si se adapta un cantidad de ARN fijo y un tiempo de reacción de amplificado y marcaje concreto, se conseguirá la cantidad de ARNc necesaria para el experimento.

Cuantificación

La cuantificación del ARN se basa, al igual que para ADN, en medidas de absorbancia mediante electrofotometría, utilizando el rango de luz ultravioleta (UV). El método espectrofotométrico está basado en la medida directa de la absorción de la radiación electromagnética por parte de la muestra, siendo esta cuantificable mediante la correlación de la Absorbancia (OD) con la concentración del ácido nucleico a determinar. En el caso del ARN, 1 OD corresponde aproximadamente 40 µg/ml de ARN. Por tanto, el cálculo de la concentración de una muestra de ARN se estima como: A260 x 40 µg/ml x Factor de dilución.

La cantidad de ARN de partida recomendada para obtener una cantidad óptima de ARNc (500 ng a 2 g) es de 50 a 500 ng, siendo la cantidad mínima 25 ng, y la máxima 11 ?L. La cuantificación de la cantidad de ARN obtenido tras la purificación, se realizó en el espectrofotómetro de amplio espectro (220-270nm) NANODROP, a partir de 1µl de muestra.

Evaluación de la calidad

Las reacciones de amplificación de ARN pueden variar considerablemente en función de la integridad y la pureza del ARN de partida. El ARN no debe estar degradado ni contaminado con proteínas o ADN. La pureza e integridad del ARN se estimó mediante una espectrofotometría y una electroforesis en gel de agarosa-formaldehído.

– Espectrofotometría: Mediante el mismo NANODROP, se evaluó la pureza del ARN midiendo la relación existente entre la absorbancia a 260 y a 280. Este valor debe estar comprendido entre 1,8 a 2, lo que indicaría que el ARN está libre de impurezas. Si el valor es menor que 1,8 significaría que el ARN tiene algún contaminante (proteínas, fenol, etano, etc). Cuando más bajo sea este valor, más contaminada está la muestra.

– Electroforesis: Se realizó una electroforesis en gel de agarosa-formaldehído para evaluar la integridad del ARN extraído.

Un ARN intacto debe tener una banda fuerte de ARNr 28s y 18s (Figura 3). Más concretamente la banda del ARNr 28s debe ser aproximadamente el doble de intensa que la banda de ARNr 18s. Esta proporción 2:1 (28s:18s) es un buen indicador de que el ARN está intacto. EL ARN parcialmente degradado tendrá un aspecto manchado sin bandas fuertes, o sin guardar la proporción 2:1. El ARN que se encuentre totalmente degradado aparecerá como una mancha de muy bajo peso molecular.

Figura 3: Electroforesis para evaluar la calidad del ARN total.

clip_image006

Para evaluar el tamaño e intensidad de las bandas así como la correcta ejecución de la técnica es necesario utilizar un marcador de tamaño de ARN (marcador de peso molecular).

Los perfiles de expresión génica se evaluaron, únicamente en aquellas muestras con una pureza e integridad adecuadas.

Atendiendo a todos estos parámetros únicamente se hibridaron 5 muestras de 4 pacientes que recibieron ventilación mecánica y 6 muestras de 6 pacientes que no requirieron la utilización de ventilación mecánica en la primera fase. En la fase adaptativa se hibridaron 14 muestras de 9 pacientes MV y 10 muestras de 6 pacientes NMV.

3. Amplificación y Marcaje

Este proceso se llevó a cabo utilizando el kit “Illumina® TotalPrep ARN Amplification” basado en un protocolo de amplificación de ARN (Van Gelder et al., 1990).

El primer paso es una retrotranscripción inversa para la síntesis de casi la totalidad de la longitud del ADN complementario (ADNc), mediante la tecnología ArrayScript, lo que asegura la obtencion de muestras reproducibles para el análisis de microarrays (Figura 4).

Figura 4: Síntesis de ADNc a partir de ARN total.

clip_image008

Para esta reacción se utilizaron cebadores T7 oligo(dT) que contienen una secuencia oligo (dT) en el extremo 3′ para la unión específica a la cadena de ARNm y una secuencia core del promotor T7 en el extremo 5′ para que la polimerasa se pueda unir y actuar. De esta manera el ADNc generado portara una secuencia promotora T7.

El segundo paso se encarga de convertir la cadena simple de ADN complementario en una doble cadena de ADN (dsADN) ya lista para el proceso de transcripción (Figura 5). La reacción emplea una ADN polimerasa y una RNasa H que simultáneamente degrada el ARN y sintetiza la segunda cadena de ADNc. Posteriormente se realiza una purificación de ADNc para eliminar posibles restos de ARN, encimas, y sales que pueden inhibir la transcripción.

Figura 5: Síntesis de ADNc de doble cadena.

clip_image010

La transcripción in vitro (TIV) de ARNc, gracias a la tecnología MEGAscript de Ambion, genera multiples copias de ARNc biotinilado a partir del dsADN, siendo este proceso la reacción de amplificación y marcado real (Figura 6). La ARN polimerasa utilizada es T7 polimerasa cuyo nombre procede del bacteriófago del que fue clonado. La ARN polimerasa T7 es dependiente de un molde ADN y muy específica para el promotor T7. Después de que la ARN polimerasa se une al promotor del ADN de doble hebra, la polimerasa separa las dos hebras y usa la cadena 3′-5′ como molde para la síntesis de una cadena de ARN 5′-3′ complementaria. Por último, se realiza una purificación de ARNc para eliminar NTPs no incorporados, enzimas y el fosfato inorgánico. Tras la purificación, el ARNc estaría listo para su hibridación en el array.

Figura 6: Síntesis de ARNc marcado con biotina.

clip_image012

4. Evaluación de la concentración, integridad y rendimiento del ARNc

Hay que tener en cuenta tanto la cantidad, calidad e integridad del ARN de partida como del ARNc generado antes de realizar la hibridación con los chips de expresión génica. Por ello debe realizarse una evaluación de la cantidad de ARNc obtenido y el rendimiento del marcaje mediante espectrofotometría.

La concentración de una solución ARNc se puede determinar midiendo su absorbancia a 260 nm. El espectrofotómetro NanoDrop 1000A (www.nanodrop.com) es recomendable porque su rapidez y facilidad de uso.

Por otra parte, la concentración de ARNc se puede determinar diluyendo una parte de la preparación en TE (10 mM Tris-HCl pH 8, 1 mM EDTA), y realizando un lectura de la absorbancia en un espectrofotómetro tradicional a 260 nm. La concentración se determina en mg / ml multiplicando el A260 por el factor de dilución y el coeficiente de extinción. (1 A260 = 40 mg / mL de ARN).

El rendimiento ARNc dependerá de la cantidad y la calidad de poli (A) ARN en el ARN total de entrada. Dado que la proporción de poli (A) ARN en el ARN total se ve afectada por condiciones como la salud del organismo y el órgano de procedencia, el rendimiento del ARNc generado a partir de una misma cantidad de ARN total puede variar considerablemente.

La integridad del ARNc se evalúa analizando el tamaño del mismo. La distribución del tamaño se evaluó mediante una desnaturalización por electroforesis en gel de agarosa-formaldehído. El ARNc amplificado debe aparecer como una marca de 250 a 5000 nt. El tamaño promedio del ARNc marcado con biotina debe ser de aproximadamente de 1200 nt.

5. Hibridación

El proceso de hibridación se realizó utilizando arrays de expresión génica de la casa Illumina, Sentrix Human-6 v2 Expression BeadChip. Cada array de expresión ofrece cobertura de todo el transcriptoma puesto que contiene 48.000 sondas de transcripción diferentes (genes bien caracterizados, genes candidatos, y variantes de empalme).

La tecnología de Illumina para el análisis de expresión génica consiste en una serie de oligonucleótidos inmovilizados por enlaces covalentes en microesferas que se localizan en micropocillos en la superficie de la matriz o array. Estas sondas poseen una secuencia de 50 bases (mer), que es la encargada de hibridar con el ARNc marcado y una secuencia denominada “address” que identifica cada microesfera dentro del array (Figura 7).

Figura 7: Diseño de las sondas. Tecnología Illumina.

clip_image014

La alta calidad y reproducibilidad de este sistema se basa en el gran número de microesferas redundantes presentes en el array, hasta 30 por sonda (lo que supondría más de 1,8 millones de microesferas en total). Además, cada microesferas contiene cientos de copias de la sonda por toda su superficie, asegurando más aun la alta sensibilidad, especificidad y precisión de la técnica (Tabla 1).

Tabla 1: Valores de sensibilidad, especificidad y presición de la técnica de microarrays.

clip_image016

El diseño de las sondas se realiza atendiendo a las secuencias de la base de datos de referencia del NCBI y de UniGene 188, de forma que el contenido de la sonda que está muy bien anotado y ampliamente aceptado.

En cuanto a la matriz que contiene las microesferas, se han utilizado técnicas litográficas estándar para crear pocillos con una distribución en forma de panal en la superficie de unas láminas de vidrio. Cada pocillo va a recoger una esfera. Las esferas se mezclan en cantidades iguales y se depositan en la superficie del arrays de forma que por desplazamiento ocuparan los pocillos de forma aleatoria. La identidad de esas microesferas vendrá determinada por la secuencia “address” que contenga.

Los chips que se han utilizado en este experimento contienen 6 arrays separados los unos de los otros por un sello, de manera que cada array puede ser hibridado con una muestra diferente.

Protocolo

Solamente se hibridaron los ARNs resultantes del proceso de transcripción in vitro y purificación con una calidad e integridad adecuadas. La hibridación se llevó a cabo con los tampones adecuados durante 30 minutos a 65ºC y posteriormente toda la noche a 58ºC. Tras la hibridación, los arrays se lavaron y posteriormente se tiñeron con Cy3-estreptavidina y se volvieron a lavar para proceder finalmente al escaneado.

6. Escaneado

El escaneado se realizó con la plataforma “Illumina BeadStation 500 GX”. Se trata de un sistema compacto de alto rendimiento de escáner para obtener imágenes de microarrays. Las microesferas son iluminadas por un haz de luz de fibra óptica que excita los compuestos fluorescentes. La emisión de fluorescencia de Cy3 se detecta cuantitativamente para el análisis posterior (Figura 8).

Figura 8: Fundamento de excitación, emisión y captura de la plataforma Illumina BeadStation 500 GX.

clip_image018

7. Procesado de la imagen y extracción de datos

El software utilizado para la adquisición y extracción de los datos fue el Illumina GenomeStudio V2010.1. Una vez obtenidos los archivos de imágenes (Figura 9), utilizando dicho software, se transformaron las intensidades de las señales obtenidas en datos numéricos.

Figura 9: Imagen obtenida tras el escaneado de los microarrays.

clip_image020

Los datos se analizan mediante un algoritmo patentado por Ilumina que permite seleccionar la mejor sonda para cada gen en la base de su capacidad de respuesta y la especificidad. Se generó una base de datos con los valores de intensidad de cada una de las sondas que codifican a un gen determinado sobre la que se realizó el análisis bioinformático. Mediante dicho software también se realizó un control de calidad para evaluar la existencia de posibles errores que tuvieron lugar durante el proceso de hibridación.

8. Análisis bioinformático

Los conjuntos de datos fueron pre-tratados mediante una normalización por cuartiles, una estabilización de la varianza, la transformación log2, y la normalización en contra de los conjuntos de datos para cuatro controles sanos. Se excluyeron aquellos genes cuyos valores correspondientes al logaritmo de la intensidad de la señal estuvieran por debajo de 6 unidades.

Para seleccionar los genes cuya expresión cambiaba como consecuencia de un estado más grave de la enfermedad se utilizaron distintas pruebas estadísticas. Se realizó un test de t Student para identificar los genes cuyos niveles de expresión eran diferentes de forma estadísticamente significativa, fijando un p valor menor de 0,05 y un filtro que solo aceptaba aquellas diferencias con un ratio mayor de 2 o menor de -2, entre ambos grupos. Para evaluar la incidencia de falsos positivos, se aplicó la corrección estadística de Benjamini-Hochberg mediante el cálculo de la tasa de falso descubrimiento (FDR).

Una vez que se obtuvo una lista de genes diferencialmente expresados entre ambos grupos, mediante el software bioinformático Ingenuity Pathways (IPA), se estudiaron las rutas canónicas y las funciones relacionadas con dichos genes, identificando aquellas rutas diferencialmente expresadas entre ambos grupos (p valor < 0,05). Para evaluar cómo se comportaban los genes pertenecientes a una determinada ruta, se generaron clustering mediante la herramienta bioinformática BRB-Array Tools v.3.8.1, desarrollada por el Dr. Richard Simon y el equipo de desarrollo de BRB-array tools. Los resultados obtenidos de los conjuntos de datos de cada microarrays fueron colgados en el repositorio público de datos de microarrays GEO. (GSE21802, http://www.ncbi.nlm.nih.gov/geo).

Como dictan las guías MIAMI, los cambios de expresión génica identificados fueron verificados por RT-PCR cuantitativa a tiempo real. Para ello, se diseñaron sondas y primers específicos para los genes más representativos del análisis. Los valores de expresión por qRT-PCR se normalizaron frente a los valores de expresión obtenidos para un gen constitutivo, GAPDH, en cada una de las muestras. Los datos de expresión obtenidos por el microarray y por qPCR se correlacionaron utilizando el software bioestadístico SPSS, mediante la prueba de correlación de Spearman. (p valor < 0,05).

Artículos relacionados: