Información

¿Se puede hacer una secuencia de ADN con Microarray?


¿Es posible realizar la secuenciación completa del ADN con Microarray o tendría que usar métodos Sanger o NGS para eso?


Los microarrays generalmente capturan genes productos, como el ARNm (a través del ADNc), que se han procesado extensamente. Debido a esto, pierde información genética como intrones o elementos reguladores. De hecho, con lo que terminarías es el transcriptoma del organismo, y sería imposible secuenciar el ADN a partir de esto. Los métodos NGS son superiores para esto, todavía, y hay una buena descripción general de las ventajas de RNAseq sobre microarrays aquí, por ejemplo. Para secuenciar el ADN probablemente usará NGS.

Fuente: JCI


El transcriptoma codificante y no codificante

Microarrays de ADN

Los microarrays de ADN (o chips de ADN) han sido la técnica más utilizada durante las últimas dos décadas para monitorear globalmente la abundancia celular de especies de transcripciones. Una micromatriz de ADN es una colección de manchas de ADN microscópicas adheridas a una superficie sólida. Cada mancha de ADN contiene muchos miles de copias de una secuencia de ADN específica, conocida como sondas. Por lo general, corresponden a una sección corta de un gen, generalmente en el extremo 3 '. Cada micromatriz incluye uno o algunos conjuntos de sondas para cada gen interrogado. Estos se utilizan para hibridar una muestra de ADNc (el objetivo) en condiciones de alta rigurosidad. La hibridación sonda-objetivo generalmente se detecta y cuantifica mediante la detección de objetivos marcados con fluoróforo, plata o quimioluminiscencia para determinar la abundancia relativa de transcripciones en la muestra objetivo. Se puede acceder a los datos sobre aproximadamente 700 000 hibridaciones de muestras realizadas en microarrays de ADN a través de las bases de datos Gene Expression Omnibus (GEO) en NCBI y ArrayExpress en EBI.

Debido a que las micromatrices de ADN requieren la localización de sondas de nucleótidos correspondientes a transcripciones conocidas, solo se puede monitorear la abundancia de estas transcripciones. La cuantificación de transcripciones previamente desconocidas, a menudo específicas del tipo de célula particular que se está interrogando y, por lo tanto, particularmente relevante para el fenotipo de este tipo de célula, es imposible. Además, las sondas generalmente se comparten entre múltiples formas de empalme del mismo gen y, a menos que se empleen diseños de matriz específicos, es imposible deconvolucionar las abundancias de isoformas de transcripción alternativas individuales a partir de la expresión génica general.


¿Se puede hacer una secuencia de ADN con Microarray? - biología

En cada tipo de célula, como una célula muscular o una célula de la piel, se expresan (activan) o silencian (desactivan) diferentes genes. Si las células que se activan mutan, podrían & # 8212dependiendo del papel que desempeñen en la célula & # 8212 hacer que la célula se vuelva anormal y se divida incontrolablemente, provocando cáncer.

Al identificar qué genes de las células cancerosas funcionan de manera anormal, los médicos pueden diagnosticar y tratar mejor el cáncer. Una forma de hacerlo es utilizar un microarreglo de ADN para determinar los niveles de expresión de los genes. Cuando un gen se expresa en una célula, genera ARN mensajero (ARNm). Los genes sobreexpresados ​​generan más ARNm que los genes subexpresados. Esto se puede detectar en la micromatriz.

El primer paso para usar una micromatriz es recolectar muestras de tejido sano y canceroso del paciente. De esta manera, los médicos pueden ver qué genes se activan y desactivan en las células sanas en comparación con las células cancerosas. Una vez que se obtienen las muestras de tejidos, el ARN mensajero (ARNm) se aísla de las muestras. El ARNm está codificado por colores con etiquetas fluorescentes y se usa para hacer una copia de ADN (el ARNm de las células sanas se tiñe de verde y el ARNm de las células anormales se tiñe de rojo).

La copia de ADN que se hace, llamada ADN complementario (ADNc), se aplica a la micromatriz. El cDNA se une a pares de bases complementarios en cada uno de los puntos de la matriz, un proceso conocido como hibridación. Según cómo se une el ADN, cada punto aparecerá rojo, verde o amarillo (una combinación de rojo y verde) cuando se escanee con un láser.

& # 8226 Una mancha roja indica que ese gen se expresó fuertemente en las células cancerosas. (En su experimento, estas manchas serán de color rosa oscuro).

& # 8226 Una mancha verde indica que ese gen estaba fuertemente reprimido en las células cancerosas. (En su experimento, estos puntos serán de color rosa claro).

& # 8226 Si una mancha se vuelve amarilla, significa que ese gen no se expresó ni se reprimió fuertemente en las células cancerosas. (En su experimento, estos puntos serán claros).

& # 8226 Una mancha negra indica que ninguno de los ADNc del paciente se ha unido al ADN en el gen ubicado en esa mancha. Esto indica que el gen está inactivo. (Todos los genes de su experimento están activos).


Implementación

MochiView está escrito en Java y se puede utilizar con cualquier sistema operativo que admita la versión 1.6 de Java o superior. Para facilitar la exploración del genoma sin problemas (mediante el almacenamiento en caché de datos) y la importación de archivos grandes, MochiView requiere hardware con un mínimo de 1 GB de memoria. Muchos navegadores de genoma introducen una capa adicional de complejidad al requerir que el usuario instale una base de datos externa o almacene datos en un servidor alojado de forma remota. MochiView evita este problema incorporando de forma transparente la base de datos Java DB dentro del software (las características específicas del diseño del software MochiView se describen en el manual de MochiView). La arquitectura de la base de datos está diseñada para escalar bien incluso con cantidades muy grandes de datos. El tamaño de la base de datos está principalmente limitado por el espacio disponible en el disco duro. En la práctica, los tamaños de las bases de datos pueden variar desde unos pocos megabytes hasta muchos gigabytes de tamaño, según el tamaño del genoma y la cantidad de datos. MochiView puede mantener múltiples bases de datos y contiene una utilidad de importación / exportación de bases de datos para facilitar el intercambio de bases de datos comprimidas (y configuraciones de trazado) entre usuarios. El usuario puede llenar cualquier base de datos con uno o más genomas importando la secuencia del genoma como uno o más archivos en formato FASTA. Luego, se pueden cargar datos adicionales basados ​​en coordenadas del genoma en los formatos GFF, BED o WIG de uso común o utilizando los propios formatos de archivo personalizados de MochiView. En el sitio web de MochiView se proporcionan consejos para configurar una base de datos.


¿Qué han hecho los microarrays por nosotros?

La tecnología de microarrays impulsó la genómica funcional, una disciplina que se esfuerza por identificar el papel de los genes en los procesos celulares, en el centro de atención porque permitió el análisis funcional de la expresión diferencial de ARN en todo el genoma entre diferentes muestras, estados y tipos de células para obtener información sobre los mecanismos moleculares que regular el destino celular, el desarrollo y la progresión de la enfermedad. Los datos de microarrays se utilizan para generar un perfil de expresión génica, que sirve como determinante de los niveles de proteínas y, por tanto, de la función celular entre muestras biológicas. Un solo experimento puede proporcionar información sobre la expresión de miles de genes, prácticamente todo el genoma humano, para comparar patrones de expresión entre dos estados cualesquiera. Los experimentos de micromatrices pueden indicar qué genes están regulados hacia arriba o hacia abajo entre muestras de tejido normal y enfermo, o dos muestras en ausencia y presencia de un determinado estímulo. Es fácil ver por qué esta tecnología podría ser atractiva para comprender sistemas biológicos complejos, así como para el descubrimiento de fármacos, el diagnóstico de enfermedades y la identificación de nuevos genes.

En la próxima entrega de esta serie Introducción a los microarrays de ADN, analizaré varios tipos de arreglos de expresión de oligonucleótidos, cómo se fabrican y sus aplicaciones comunes. Manténganse al tanto…


Genómica y proteómica plaquetaria

Ángel García,. Steve P. Watson, en Plaquetas (segunda edición), 2007

Microarrays de ADN

Los microarrays de ADN representan una forma relativamente rápida y rentable de estudiar la expresión génica a escala genómica. Se pueden generar datos de expresión para miles de genes en muchos tipos de células y tejidos diferentes expuestos a una variedad de estímulos. La tecnología de micromatrices de ADN se basa en el principio de que cada hebra de ADN en una muestra compleja tiene la capacidad de reconocer e hibridar con su secuencia complementaria inmovilizada en una región específica de la micromatriz de ADN. Estos microarrays de ADN generalmente se hacen en portaobjetos de vidrio de una de estas dos formas: imprimiendo ADN (a menudo productos de reacción en cadena de la polimerasa [PCR] u oligonucleótidos) utilizando un arreglo robótico, como se desarrolló en el laboratorio de Patrick Brown en la Universidad de Stanford 2 o por en el lugar síntesis de oligonucleótidos mediante un proceso denominado fotolitografía, desarrollado por Affymetrix. 3 Estos métodos pueden producir microarrays con miles de secuencias de ADN discretas. Por ejemplo, Affymetrix GeneChips contienen 600.000 oligonucleótidos diferentes por centímetro cuadrado (www.affymetrix.com).

La principal ventaja de la tecnología de microarrays desarrollada por Brown Laboratory es la relativa facilidad con la que todo el sistema se puede configurar en un laboratorio académico (para obtener instrucciones, consulte www.cmgm.stanford.edu/pbrown), lo que permite a los investigadores producir sus propios microarrays personalizados de una manera rentable. 9 Para tales microarrays, cada experimento generalmente está diseñado para comparar la abundancia relativa de secuencias de genes entre dos muestras de ADN o ARN diferentes (figura 5-1A). Las dos muestras se etiquetan inicialmente con un tinte fluorescente diferente, como Cy3 (rojo) o Cy5 (verde), y luego se mezclan e hibridan con el microarray. Se usa un microscopio para medir la fluorescencia de los dos tintes para cada mancha, y la proporción de rojo a verde es una medida de la abundancia relativa del gen en las dos muestras de ácido nucleico. Varias muestras experimentales se pueden comparar indirectamente mediante el uso de múltiples micromatrices, cada una hibridada con una muestra de referencia común, para permitir la normalización, y una muestra experimental. 10

Figura 5-1. Esquema de los dos tipos principales de microarrays de ADN. A. El ADN complementario impreso (ADNc) o la micromatriz de oligonucleótidos. En este ejemplo, 60 puntos de datos muestran la eficiencia de hibridación con 60 ADNc u oligonucleótidos impresos diferentes que representan 60 genes. Una señal verde indica una expresión génica relativamente alta en la muestra 1, una señal roja indica una expresión génica alta en la muestra 2, una señal amarilla indica una expresión génica equivalente en ambas muestras y el gris indica una falta de expresión génica en ambas. B. La micromatriz de oligonucleótidos sintéticos. En este ejemplo del tipo de micromatriz Affymetrix, cada gen en la micromatriz está representado por una fila de 22 oligonucleótidos 25-mer diferentes, cada uno con su propio control de desajuste en la fila siguiente. Se muestran los datos de cuatro genes diferentes, con amarillo que indica hibridación detectable y gris que indica que no hay hibridación. Los análisis computacionales determinan si los genes individuales están "presentes" en la muestra de ARNm (por ejemplo, el gen en la parte superior de la micromatriz), si son "equívocos" o "ausentes" (por ejemplo, el gen en la parte inferior de la micromatriz).

La principal ventaja del método de matriz de oligonucleótidos sintéticos es la mayor confiabilidad de los datos como resultado del uso de múltiples "oligos" por gen, incluidos los controles de desajuste para cada uno. 11 La desventaja es que la fabricación de microarrays de alta tecnología no se puede establecer fácilmente en el entorno académico. En cambio, los microarrays de ADN se compran a empresas como Affymetrix. Como se mencionó, los Affymetrix GeneChips contienen típicamente 22 oligonucleótidos de 25 meros diferentes (denominados sondas) para cada gen. Para cada una de estas 22 sondas, también se sintetiza una sonda de desajuste con una única sustitución de nucleótido central como control para la hibridación inespecífica. Los experimentos están diseñados para analizar una sola muestra de ADN o ARN que está marcada con fluorescencia, hibridada con el GeneChip y las señales detectadas por escaneo de fluorescencia confocal con láser (Fig. 5-1B). La reproducibilidad y precisión relativamente altas de las matrices de oligonucleótidos sintéticos permite la comparación directa de datos entre experimentos, después de la normalización de la mediana general o la intensidad media de cada GeneChip a un estándar común. 10


Nuevos productos en Transcriptómica

Producto destacado

Preparación de MY-PCR

MY-PCR Prep proporciona al técnico de laboratorio de biología molecular una "sala limpia personal" para su uso en la amplificación de ADN y ARN. Entre amplificaciones, My-PCR Prep puede irritarse con energía ultravioleta (UV) de onda corta para desnaturalizar contaminantes potenciales y eliminar su capacidad de amplificación. La cámara principal de MY-PCR Prep está construida con una pieza continua de policarbonato para evitar que la luz ultravioleta se escape de la cámara durante la irritación. El acceso del operador se obtiene a través de la hoja de policarbonato frontal plegable, superpuesta para eliminar los espacios en la cámara durante la irritación de la luz ultravioleta. La superficie de trabajo es de polipropileno blanco, lo que facilita la desinfección y limpieza. My-PCR Prep es una estación de trabajo de flujo laminar vertical Clase 100 con luz ultravioleta temporizada, lo que la convierte en una zona de limpieza personal ideal para realizar reacciones en cadena de la polimerasa (PCR) y amplificaciones de ARN. My-PCR Prep está disponible en modelos de 110 V CA de 24 ", 32" y 48 "de ancho.

Estaciones de trabajo de preparación para PCR
Para información: 877-328-3912
Mystaire

Ensayos precisos

Los ensayos precisos ultrasensibles se han diseñado para experimentos de RNA-seq dirigidos utilizando células individuales. Basados ​​en la tecnología patentada de Indización Molecular, los Ensayos Precisos examinan un gran número de muestras de ARNm estándar o de entrada baja de muestras preciosas, o siempre que se requiera una cuantificación absoluta. Los ensayos combinan la indexación molecular y de muestras en formatos de 96 y 384 muestras, lo que permite a los clientes secuenciar hasta 4.608 muestras en un ciclo de secuenciación sin tener que invertir en nuevos equipos o una amplia formación. Cellular Research está colaborando con Seven Bridges Genomics para ofrecer a los clientes una línea de análisis completa, que proporciona una plataforma de datos integrada basada en la nube para la gestión, ejecución y colaboración de los experimentos RNA-seq en una plataforma informática robusta y fácil de usar. El diseño robusto y las tuberías de análisis de datos ofrecen una solución simple llave en mano para experimentos específicos de RNA-seq.

Ensayos de secuencia de ARN
Para información: 650-752-6144
Investigación celular

Kit KAPA Stranded RNA-Seq

Un nuevo kit de preparación de bibliotecas de ARN para flujos de trabajo de secuenciación de próxima generación (NGS) permite a los usuarios generar una vista más completa del transcriptoma detectando transcripciones únicas y de baja abundancia. El kit KAPA Stranded RNA-Seq con RiboErase utiliza un método de agotamiento enzimático dirigido para eliminar el ARN ribosómico (ARNr) y, por lo tanto, mejorar la eficiencia de la secuenciación. En la preparación de bibliotecas de ARN, incluso pequeñas cantidades de ARNr residual pueden reducir drásticamente la eficiencia de la secuenciación y la calidad de los datos. Utilizando el agotamiento enzimático, el kit KAPA Stranded RNA-Seq con RiboErase reduce el rRNA a tasas líderes en la industria del 99,98%. El kit proporciona una alternativa al enriquecimiento de ARNm, ya que el agotamiento del ARNr permite el análisis de regiones exónicas, ARNm precursores y ARN largos no codificantes. El kit KAPA Stranded RNA-Seq con RiboErase está disponible para su uso con muestras de humanos, ratones y ratas y es robusto y reproducible con cantidades de entrada flexibles. Los kits también contienen una enzima de ingeniería de bajo sesgo llamada KAPA HiFi e incluyen un protocolo optimizado "con cuentas".

Ensayos de transcriptoma de ratón y rata - 1.0 (MTA 1.0)

Los ensayos de transcriptoma de ratón y rata 1.0 son herramientas potentes y flexibles para medir una amplia gama de cambios de expresión en las regiones codificantes y no codificantes largas de los transcriptomas de ratón y rata. El ensayo de transcriptoma de ratón 1.0 (MTA 1.0) y el ensayo de transcriptoma de rata 1.0 (RTA 1.0) proporcionan un rico conjunto de datos suficiente para descifrar cambios en múltiples niveles en un solo experimento de una variedad de tipos de muestras. Con aproximadamente diez sondas de detección por exón y cuatro sondas por unión de empalme exón-exón, estos ensayos generan los datos de expresión de transcriptoma completo más completos, precisos y reproducibles con la flexibilidad de seleccionar el nivel de análisis: nivel de gen, nivel de transcripción, ARN codificante de proteínas o no codificante largo. Para obtener conocimientos biológicos de manera simple, rápida y sin problemas, las soluciones completas de transcriptoma de ratón y rata incluyen un software de análisis intuitivo que transforma los datos de expresión de alta calidad generados por los ensayos en información biológicamente significativa en minutos.

Ensayos de transcriptomas
Para información: 888-362-2447
Affymetrix

Sistema KingFisher Duo Prime

Los laboratorios de rendimiento bajo y medio ahora tienen una alternativa a los procesos manuales y los métodos de columna de giro para la purificación de ácidos nucleicos, gracias a un nuevo sistema automatizado. Diseñado para laboratorios de investigación y pequeñas empresas de biotecnología que buscan simplificar los procesos de purificación de ADN, ARN y proteínas, el nuevo sistema KingFisher Duo Prime se basa en la utilidad del sistema KingFisher Duo existente para ayudar a mejorar la reproducibilidad y entregar muestras de alta calidad en menos tiempo y esfuerzo que los métodos manuales tradicionales. Con KingFisher Duo, aislar el ADN de 12 muestras de sangre toma tan solo 53 minutos y solo requiere 15 minutos de tiempo práctico, en comparación con los métodos manuales de columna giratoria, que requieren hasta 90 minutos de tiempo práctico. Los sistemas Thermo Scientific KingFisher están diseñados para aislar ADN, ARN y proteínas de una variedad de materiales de partida, incluidos fluidos corporales libres de células, sangre, bacterias, cultivos celulares, tejidos y muestras de plantas.

Sistema de purificación de ácidos nucleicos y proteínas.
Para información: 800-556-2323
Thermo Fisher Scientific

Envíe el comunicado de prensa / descripción de su nuevo producto o la información de la documentación del producto a [email protected] Visite Science New Products para obtener más información.

En este espacio se presenta la instrumentación, los aparatos y los materiales de laboratorio recientemente ofrecidos de interés para los investigadores de todas las disciplinas en organizaciones académicas, industriales y gubernamentales. Se enfatiza el propósito, las características principales y la disponibilidad de productos y materiales. El respaldo de Science o AAAS de cualquier producto o material mencionado no está implícito. Se puede obtener información adicional del fabricante o proveedor.


RESULTADOS

Los datos del transcriptoma se obtuvieron de las dos zonas de la punta de la raíz (Fig. 1) a través de microarrays y RNA-Seq. Se detectaron un total de aproximadamente 33.500 y 22.700 genes expresados ​​en las zonas de la raíz de RNA-Seq y microarray, respectivamente (Gene Expression Omnibus [GEO] acceso GSE115555).

Genes expresados ​​diferencialmente en las dos zonas de raíces

Microarray detectó un total de 6351 genes alterados significativamente con un cambio de veces de 2 o más, mientras que RNA-Seq detectó un total de 6403 genes que se expresaron diferencialmente entre las dos zonas de la raíz. Entre estos dos conjuntos de genes, 4180 genes se identificaron comúnmente mediante ambas técnicas (Fig. 2A). De los 6403 genes detectados por RNA-Seq, 2223 genes eran exclusivos de RNA-Seq con un cambio de 2 veces o más. Sin embargo, de estos 2223 genes, 771 eran verdaderamente exclusivos de RNA-Seq y los 1452 genes restantes se detectaron mediante microarrays, pero no pasaron el valor de corte del cambio de veces 2 o más (log2 FC ≥1 o ≤1). Los niveles de expresión de genes estimados por RNA-Seq fueron más altos que los estimados por microarrays. Por lo tanto, un mayor número de genes pasó el criterio de corte de cambio de veces en RNA-Seq que en el microarray. Con mayores requisitos de cambio de veces, RNA-Seq detectó un mayor número de genes en comparación con la micromatriz (Fig. 2B, C). A niveles de cambio de veces de 4 y 8, RNA-Seq identificó 364 y ​​63 genes únicos en comparación con 41 y seis genes, respectivamente, identificados por la micromatriz (círculos internos en el diagrama de Venn, Fig. 2). En general, RNA-Seq fue más eficiente en la detección de un mayor número de genes modificados significativamente en comparación con la micromatriz.

Los genes expresados ​​diferencialmente en las dos zonas de la raíz eran funcionalmente distintos

La distribución de las transcripciones en las categorías de GO más prominentes se resume en la Tabla 1. Los grupos funcionales regulados al alza enumerados en la Tabla 1 son los enriquecidos en la Zona 2, que incluyen localización y transporte de lípidos, morfogénesis de la raíz, diferenciación de células epidérmicas de la raíz, maduración celular, biosintético de polipropenoides proceso, diferenciación de las células ciliadas de la raíz, maduración de los tricoblastos y proceso metabólico secundario. Los genes regulados negativamente en la Zona 2 son los genes enriquecidos en la Zona 1 de la raíz (punta). El análisis GO de estos genes se agruparon principalmente en grupos funcionales: regulación del ciclo celular, ensamblaje de complejos de ADN de proteínas, ensamblaje de cromatina, empaquetamiento de ADN y proceso metabólico, organización del citoesqueleto, división celular, biogénesis y organización de componentes celulares (Tabla 1).

Regulado al alza Regulado a la baja
Ir a término Descripción FDR Ir a término Descripción FDR
IR: 0010876 Localización de lípidos 4.00E-16 IR: 0051726 Regulación del ciclo celular 3.70E-06
IR: 0006869 Transporte de lípidos 1.20E-07 IR: 0007049 Ciclo celular 3.90E-06
IR: 0042221 Respuesta al estímulo químico 8.80E-07 IR: 0065004 Ensamblaje del complejo proteína-ADN 7.50E-05
IR: 0009698 Proceso metabólico fenilpropanoide 1.10E-05 IR: 0031497 Ensamblaje de cromatina 7.50E-05
IR: 0010054 Diferenciación de tricoblastos 1.80E-05 IR: 0006323 Embalaje de ADN 0.0001
IR: 0006810 Transporte 2.10E-05 IR: 0007166 Vía de señalización ligada al receptor de la superficie celular 0.00021
IR: 0010015 Morfogénesis de la raíz 2.10E-05 IR: 0006333 Montaje o desmontaje de cromatina 0.0003
IR: 0051234 Establecimiento de localización 2.20E-05 IR: 0007167 Vía de señalización de la proteína receptora ligada a enzimas 0.00046
IR: 0010053 Diferenciación de células epidérmicas radiculares 3.70E-05 IR: 0007169 Vía de señalización de la proteína tirosina quinasa del receptor transmembrana 0.00046
IR: 0006725 Proceso metabólico de compuestos aromáticos celulares 4.30E-05 IR: 0022402 Proceso del ciclo celular 0.00063
IR: 0051179 Localización 4.80E-05 IR: 0051301 División celular 0.00067
IR: 0050896 Respuesta al estímulo 7.20E-05 IR: 0006996 Organización de orgánulos 0.0015
IR: 0009699 Proceso biosintético fenilpropanoide 8.80E-05 IR: 0022607 Ensamblaje de componentes celulares 0.0024
IR: 0019748 Proceso metabólico secundario 0.0001 IR: 0007010 Organización del citoesqueleto 0.0034
IR: 0048469 Maduración celular 0.00011 IR: 0048366 Desarrollo foliar 0.0055
IR: 0048765 Diferenciación de las células ciliadas de la raíz 0.00011 IR: 0044085 Biogénesis de componentes celulares 0.0059
IR: 0048764 Maduración de tricoblastos 0.00011 IR: 0016043 Organización de componentes celulares 0.0067
IR: 0009664 Organización de la pared celular de tipo vegetal 0.00015 IR: 0006259 Proceso metabólico del ADN 0.0068
IR: 0048468 Desarrollo celular 0.00016 IR: 0006325 Organización de la cromatina 0.0073
IR: 0022622 Desarrollo del sistema de raíces 0.00023 IR: 0048827 Desarrollo de filomas 0.0088
  • FDR = tasa de falsos descubrimientos.
  • a Análisis de ontología genética (GO) de los genes significativamente modificados entre la Zona 2 y la Zona 1 realizado utilizando agriGO (Du et al., 2010). Los grupos funcionales regulados al alza son aquellos enriquecidos en la Zona 2; los grupos regulados a la baja son los enriquecidos en la Zona 1.

Algunos de los genes expresados ​​diferencialmente a niveles altos de veces (Tabla 2) y sus funciones como se definen en el Arabidopsis La base de datos TAIR (Huala et al., 2001) se describe a continuación.

ID del gen de registro ARRIBA Tronco2 FC RNA-Seq Tronco2 Micromatriz FC Número de acceso y breve descripción
AT4G40090 10.14 6.17 NM_120175. ARNm de Arabidopsis thaliana AGP3 (arabinogalactano-proteína 3) (AGP3), cds completos.
AT1G48750 9.01 5.21 NM_103770. Inhibidor de la proteasa de Arabidopsis thaliana / almacenamiento de semillas / proteína de transferencia de lípidos (LTP) familia de proteínas (AT1G48750) mRNA, cds completos.
AT5G05960 8.93 5.76 NM_120678. Inhibidor de la proteasa de Arabidopsis thaliana / almacenamiento de semillas / proteína de transferencia de lípidos (LTP) familia de proteínas (AT5G05960) mRNA, cds completos.
AT3G18280 8.82 4.93 NM_112712. Inhibidor de la proteasa de Arabidopsis thaliana / almacenamiento de semillas / proteína de transferencia de lípidos (LTP) familia de proteínas (AT3G18280) mRNA, cds completos.
AT1G12040 8.53 7.29 NM_101076. Arabidopsis thaliana LRX1 (REPETICIÓN / EXTENSINA RICA EN LEUCINA 1) histidina fosfotransfer quinasa / unión a proteínas / constituyente estructural de la pared celular (LRX1) ARNm, cds completos.
AT5G67400 8.46 7.98 NM_126140. Arabidopsis thaliana peroxidasa 73 (PER73) (P73) (PRXR11) (AT5G67400) mRNA, cds completos.
AT1G10380 8.31 5.16 NM_100912. Arabidopsis thaliana ARNm de lipoproteínas de membrana putativo, cds completos.
AT3G54590 8.21 5.49 NM_115316. Arabidopsis thaliana ARNm ATHRGP1 (GLICOPROTEÍNA RICA EN HIDROXIPROLINA) constituyente estructural de la pared celular (ATHRGP1), cds completos.
AT3G25930 8.08 5.96 NM_113497. ARNm de la familia de la proteína de estrés universal (USP) de Arabidopsis thaliana (AT3G25930), cds completos.
AT5G65530 8.01 6.86 NM_125951. Proteína quinasa de Arabidopsis thaliana, ARNm putativo (AT5G65530), cds completos.
AT1G02900 7.84 6.83 NM_100171. Arabidopsis thaliana RALF1 (FACTOR DE ALCALINIZACIÓN RÁPIDA 1) transductor de señal (RALF1) mRNA, cds completos.
AT1G30870 7.76 6.18 NM_102824. Peroxidasa catiónica de Arabidopsis thaliana, ARNm putativo (AT1G30870), cds completos.
AT1G48930 7.68 7.19 NM_103786. Arabidopsis thaliana AtGH9C1 (Arabidopsis thaliana glicosil hidrolasa 9C1) catalítica / hidrolasa, hidrolizando compuestos de O-glicosilo (AtGH9C1) ARNm, cds completos.
AT5G58010 7.68 5.77 NM_125186. ARNm de la familia de proteínas (AT5G58010) hélice-bucle-hélice básica (bHLH) de Arabidopsis thaliana, cds completos.
AT1G75750 7.64 7.02 NM_106225. Arabidopsis thaliana ARNm de GASA1 (GAST1 PROTEIN HOMOLOG 1) (GASA1), cds completos.
AT5G66815 7.54 5.29 NM_126080. Arabidopsis thaliana PÉPTIDO 5 TERMINALMENTE CODIFICADO EN C, ARNm de proteína transmembrana CEP5 (AT5G66815), cds completos.
AT3G21550 7.51 3.09 NM_113050. ARNm de Arabidopsis thaliana DUF679 DOMAIN MEMBRANE PROTEIN 2, ATDMP2, DMP2, DUF679 DOMAIN MEMBRANE PROTEIN 2 (AT3G21550), cds completos.
AT3G10340 7.40 5.17 NM_111869. Arabidopsis thaliana PAL4 (fenilalanina amoniaco-liasa 4) amoniaco ligasa / amoniaco-liasa / ARNm catalítico (PAL4), cds completos.
AT4G02270 7.39 6.70 NM_116460. Arabidopsis thaliana polen Ole e 1 alérgeno y proteína de la familia extensina (AT4G02270) mRNA, cds completos.
AT5G44130 7.37 5.33 NM_123780. Arabidopsis thaliana FLA13 (PRECURSOR DE PROTEÍNA 13 ARABINOGALACTANA FASCICLINA) (FLA13) mRNA, cds completos.
AT5G19520 −5.59 −4.39 NM_121957. Arabidopsis thaliana MSL9 (CANAL MECANOSENSIBLE DE PEQUEÑA CONDUCTANCIA COMO 9) ARNm del canal iónico activado mecánicamente (MSL9), cds completos.
AT3G13175 −5.61 −3.43 NM_112157. ARNm de proteína desconocida de Arabidopsis thaliana (AT3G13175), cds completos.
AT2G38810 −5.72 −5.54 NM_129438. Arabidopsis thaliana ARNm de unión a ADN (HTA8) de HTA8 (HISTONE H2A 8), cds completos.
AT5G13870 −5.78 −4.06 NM_121390. Arabidopsis thaliana EXGT-A4 (ENDOXYLOGLUCAN TRANSFERASE A4) hidrolasa, que actúa sobre enlaces glicosilo / hidrolasa, hidrolizando compuestos O-glicosilo / ARNm de x & gt (EXGT-A4), cds completos.
AT1G57590 −5.79 −4.63 NM_104556. ARNm de Arabidopsis thaliana carboxilesterasa (AT1G57590), cds completos.
AT3G51280 −5.99 −3.91 NM_114987. Esterilidad masculina de Arabidopsis thaliana MS5, ARNm putativo (AT3G51280), cds completos.
AT2G23050 −6.26 −5.40 NM_127869. Arabidopsis thaliana NPY4 (PINS DESNUDOS EN YUC MUTANTS 4) ARNm de transductor de señal / unión a proteínas (NPY4), cds completos.
AT2G22610 −6.30 −2.95 NM_127826. ARNm relacionado con la proteína motora kinesina de Arabidopsis thaliana (AT2G22610), cds completos.
AT2G34020 −6.35 −3.11 NM_128953. ARNm de unión a iones de calcio de Arabidopsis thaliana (AT2G34020), cds completos.
AT5G48940 −6.38 −4.74 NM_124271. Arabidopsis thaliana proteína quinasa transmembrana repetida rica en leucina, ARNm putativo (AT5G48940), cds completos.
AT2G20515 −6.48 −3.32 NM_127611. ARNm de la proteína alergénica de la familia Ole e I de polen de Arabidopsis thaliana (AT2G20515), cds completos.
AT2G25060 −6.51 −4.12 NM_128063. ARNm de proteína que contiene dominio similar a plastocianina (AT2G25060) de Arabidopsis thaliana, cds completos.
AT3G52910 −6.52 −2.97 At3g52910. 68416.t05420 expresó una proteína casi idéntica al activador de la transcripción GRL4 [Arabidopsis thaliana] GI: 21539886 (no publicado)
AT2G45050 −6.81 −5.12 NM_130069. ARNm de la familia de proteínas (AT2G45050) de dedos de zinc (tipo GATA) de Arabidopsis thaliana, cds completos.
AT5G60530 −6.88 −4.32 NM_125446. Arabidopsis thaliana ARNm abundante relacionado con la proteína / relacionado con la proteína LEA (AT5G60530) de embriogénesis tardía, cds completos.
AT5G10130 −7.22 −5.16 NM_121051. Arabidopsis thaliana polen Ole e 1 alérgeno y proteína de la familia extensina (AT5G10130) mRNA, cds completos.
AT1G18250 −7.39 −5.43 NM_001035987. ARNm de Arabidopsis thaliana ATLP-1 (ATLP-1), cds completos.
AT5G28640 −7.86 −5.71 NM_122747. Arabidopsis thaliana ARNm de coactivador de transcripción / unión a proteínas AN3 (ANGUSTIFOLIA 3) (AN3), cds completos.
AT2G28790 −7.93 −5.44 NM_128438. Proteína similar a la osmotina de Arabidopsis thaliana, ARNm putativo (AT2G28790), cds completos.
AT1G52070 −9.15 −5.77 NM_104088. ARNm de la familia de lectinas de jacalina de Arabidopsis thaliana (AT1G52070), cds completos.

La Zona Raíz 2 se enriqueció con genes involucrados en procesos metabólicos de crecimiento secundario como la respuesta al estímulo, elongación celular, diferenciación y desarrollo del vello radicular y maduración (Tabla 1). Los genes de estas categorías incluían proteínas de arabinogalactano (AT4G40090, AT5G44130), proteína básica de hélice-bucle-hélice (bHLH) (AT5G58010) y proteínas de la familia de repeticiones ricas en leucina (LRX) / extensina (AT1G12040, AT4G02270). Otro conjunto de genes altamente enriquecidos en la Zona 2 son las proteínas del metabolismo de lípidos: las proteínas de la familia de proteínas inhibidoras de proteasa / almacenamiento de semillas / transferencia de lípidos (LTP) (AT1G48750, AT5G05960, AT3G18280). También se indujeron peroxidasas que son específicas del pelo de la raíz (AT5G67400, AT1G30870) y el gen de señalización celular (AT1G02900).

La zona de la raíz 1 se enriqueció con genes implicados en el metabolismo del crecimiento primario, como los componentes celulares, el ciclo celular y el metabolismo del ADN. Los genes enriquecidos en la zona 1 de la punta de la raíz incluían: genes de organización y biogénesis de la pared celular (AT5G13870, AT1G57590) regulación de la expresión génica (AT3G52910, AT2G45050) Unión de ATP / microtúbulos (AT2G22610, AT5G48940) división celular / ciclo celular (AT3G51280, AT2G28790) a estímulos mecánicos, lumínicos y de organismos (AT2G23050 [gravitropismo], AT2G45050 [ligero], AT5G19520 [mecánico], AT1G18250 y AT2G28790 [patógeno]). Otros genes enriquecidos en la Zona 1 incluyeron aquellos con función predicha de unión y transporte de iones (AT5G19520, AT2G34020, AT2G25060), junto con la proteína abundante en embriogénesis tardía (LEA) (AT5G60530).

Genes únicos / nuevos identificados por RNA-Seq no identificados por microarrays

RNA-Seq detectó 771 genes que no fueron detectados por el microarray (Apéndice S1). Trescientos treinta y nueve genes se enriquecieron en la Zona 2 de la punta de la raíz (regulada al alza en la Zona 2), y 432 genes se enriquecieron en la Zona 1 de la punta de la raíz (regulada a la baja en la Zona 2) (Apéndice S1). El análisis de GO de estos genes agrupó los genes en los siguientes grupos: componente estructural del ribosoma, actividad molecular estructural y actividad del factor de elongación de la traducción. Los 20 genes principales con el mayor cambio de veces se enumeran en la Tabla 3. Estos incluyen la proteína de la familia extensina (AT3G09925), el transportador de fosfato 1 (AT5G43350), la proteína 17 de la familia ovada (AT2G30395), la proteína de la superfamilia similar a la pectina liasa (AT4G23500), la respuesta a las citoquininas factor 4 (AT4G27950), proteína de la familia de las proteínas quinasas (AT5G07140), proteína de la familia de la transducina (AT4G33270) y proteína similar a la defensina (AT4G22235).

Gene Tronco2 FC Símbolo Breve descripción
AT5G07322 7.72 N / A Otro ARN [Fuente: TAIRAcc: AT5G07322]
AT3G09925 7.35 N / A Pollen Ole e 1 alérgeno y proteína de la familia de las extensinas [Fuente: TAIRAcc: AT3G09925]
AT1G28815 7.15 N / A La proteína desconocida tiene cinco golpes BLAST a cinco proteínas en dos especies: Archae - 0 Bacteria - 0 Metazoa - 0 Hongos - 0 Plantas - 5 Virus - 0 Otros eucariotas - 0 (fuente: NCBI BLink). [Fuente: TAIRAcc: AT1G28815]
AT5G48920 7.06 TED7 Relacionado con la diferenciación del elemento traqueario 7 [Fuente: TAIRAcc: AT5G48920]
AT5G43350 6.94 ATPT1 Transportador de fosfato 11 [Fuente: TAIRAcc: AT5G43350]
AT2G30395 6.92 ATOFP17 Proteína 17 de la familia ovada [Fuente: TAIRAcc: AT2G30395]
AT3G24460 6.81 N / A Dominio de serina que contiene proteína de biosíntesis de serina y esfingolípidos [Fuente: TAIRAcc: AT3G24460]
AT5G57887 6.63 N / A Proteína desconocida FUNCIONES EN: función_molecular desconocida INVOLUCRADA EN: proceso_biológico desconocido UBICADO EN: sistema de endomembrana Tiene 30201 Golpes explosivos a 17322 proteínas en 780 especies: Archae - 12 Bacteria - 1396 Metazoa - 17338 Hongos - 3422 /… / - 5037 Virus - 0 Otros eucariotas - 2996 (fuente: NCBI BLink). [Fuente: TAIRAcc: AT5G57887]
AT2G28671 6.50 N / A Unknown protein FUNCTIONS IN: molecular_function unknown INVOLVED IN: biological_process unknown LOCATED IN: cellular_component unknown Has 30201 Blast hits to 17322 proteins in 780 species: Archae - 12 Bacteria - 1396 Metazoa - 17338 Fungi - /…/ Plants - 5037 Viruses - 0 Other Eukaryotes - 2996 (source: NCBI BLink). [Source:TAIRAcc:AT2G28671]
AT1G77885 6.45 N / A Unknown protein BEST Arabidopsis thaliana protein match is: unknown protein (TAIR:AT1G22065.1) Has 35333 Blast hits to 34131 proteins in 2444 species: Archae - 798 Bacteria - 22429 Metazoa - 974 Fungi - 991 Plants - 531 Viruses - 0 Other Euk /…/s - 9610 (source: NCBI BLink). [Source:TAIRAcc:AT1G77885]
AT5G19230 6.17 N / A Glycoprotein membrane precursor GPI-anchored [Source:TAIRAcc:AT5G19230]
AT4G23500 5.85 N / A Pectin lyase-like superfamily protein [Source:TAIRAcc:AT4G23500]
AT4G27950 −4.04 CRF4 Cytokinin response factor 4 [Source:TAIRAcc:AT4G27950]
AT3G63430 −4.10 TRM5 TON1 RECRUITING MOTIF 5, TRM5 zinc finger CCCH domain protein(source:Araport11)
AT5G01445 −4.13 N / A Unknown protein FUNCTIONS IN: molecular_function unknown INVOLVED IN: biological_process unknown LOCATED IN: mitochondrion Has 5 Blast hits to 5 proteins in 2 species: Archae - 0 Bacteria - 0 Metazoa - 0 Fungi - 0 Plants - 5 Viruses - 0 Ot /…/karyotes - 0 (source: NCBI BLink). [Source:TAIRAcc:AT5G01445]
AT5G41071 −4.20 N / A Unknown protein Has 30201 Blast hits to 17322 proteins in 780 species: Archae - 12 Bacteria - 1396 Metazoa - 17338 Fungi - 3422 Plants - 5037 Viruses - 0 Other Eukaryotes - 2996 (source: NCBI BLink). [Source:TAIRAcc:AT5G41071]
AT5G07140 −4.50 N / A Protein kinase superfamily protein [Source:TAIRAcc:AT5G07140]
AT4G33270 −4.74 CDC20.1 Transducin family protein / WD-40 repeat family protein [Source:TAIRAcc:AT4G33270]
AT4G22235 −5.24 N / A Arabidopsis defensin-like protein [Source:TAIRAcc:AT4G22235]
AT2G22496 −5.56 MIR779A MIR779a miRNA [Source:TAIRAcc:AT2G22496]

Furthermore, a total of 107 novel transcripts were identified that were mapped to the genome but did not have any gene annotation in the reference genome database. Out of these 107 transcripts, 19 were found to be significantly changed between the zones at FDR < 0.01 (Appendix S2).

Additional information from RNA-Seq on differentially expressed genes

In addition to the differential gene expression data, RNA-Seq provided information on isoforms, coding DNA sequences, and transcription start sites. Figure 3 provides examples of isoform information from four different genes in Zone 2 that were significantly altered between the two root zones to study their isoform information—two upregulated genes: AT5G05960 (protease inhibitor/seed storage/lipid transfer protein [LTP] family protein) and AT4G02270 (pollen Ole e 1 allergen and extensin family protein) and two downregulated genes: AT2G23050 (NPY4 [NAKED PINS IN YUC MUTANTS 4]) and protein binding/signal transducer (NPY4) and AT1G18250 (Arabidopsis thaumatin-like protein [ATLP-1]). The differential expression of these four genes in the two root zones from microarray and RNA-Seq are shown in Fig. 3A. Log2 FC values for these genes in RNA-Seq and microarray were comparable, and RNA-Seq estimated a higher level of fold change for all four genes (Fig. 3A). Expression levels of these genes (Fig. 3B) and isoforms (Fig. 3C) in root Zone 1 and 2 were plotted using FPKM values measured by RNA-Seq. Although all of these genes were significantly changed between Zone 1 and Zone 2 (Fig. 3B), the different FPKM values measured can be attributed to changes in alternative isoforms (Fig. 3C). For instance, the FPKM values of two isoforms of genes AT5G05960 and AT2G23050 are not significantly changed individually (Fig. 3C), but when the expression values are added up there is a significant change in gene expression (Fig. 3B). On the contrary, in genes AT4G02270 and AT1G18250, one isoform in each gene (TCONS_00025944 and TCONS_00005036, respectively) was significantly altered in expression, leading to a change in the total FPKM values (Fig. 3C).


Types of Microarrays

Depending upon the kind of immobilized sample used construct arrays and the information fetched, the Microarray experiments can be categorized in three ways:

1. Microarray Expression Analysis: In this experimental setup, the cDNA derived from the mRNA of known genes is immobilized. The sample has genes from both the normal as well as the diseased tissues. Spots with more intensity are obtained for diseased tissue gene if the gene is over expressed in the diseased condition. This expression pattern is then compared to the expression pattern of a gene responsible for a disease.

2. Microarray for Mutation Analysis: For this analysis, the researchers use gDNA. The genes might differ from each other by as less as a single nucleotide base.

A single base difference between two sequences is known as Single Nucleotide Polymorphism (SNP) and detecting them is known as SNP detection.

3. Comparative Genomic Hybridization: It is used for the identification in the increase or decrease of the important chromosomal fragments harboring genes involved in a disease.


Genomic and microarray approaches to coral reef conservation biology

New technologies based on DNA microarrays and comparative genomics hold great promise for providing the background biological information necessary for effective coral reef conservation and management. Microarray analysis has been used in a wide range of applications across the biological sciences, most frequently to examine simultaneous changes in the expression of large numbers of genes in response to experimental manipulation or environmental variation. Other applications of microarray methods include the assessment of divergence in gene sequences between species and the identification of fast-evolving genes. Arrays are presently available for only a limited range of species, but with appropriate controls they can be used for related species, thus avoiding the considerable costs associated with development of a system de novo. Arrays are in use or preparation to study stress responses, early development, and symbiosis in Acropora y Montastraea. Ongoing projects on several corals are making available large numbers of expressed gene sequences, enabling the identification of candidate genes for studies on gamete specificity, allorecognition and symbiont interactions. Over the next few years, microarray and comparative genomic approaches are likely to assume increasingly important and widespread use to study many aspects of the biology of coral reef organisms. Application of these genomic approaches to enhance our understanding of genetic and physiological correlates during stress, environmental disturbance and disease bears direct relevance to the conservation of coral reef ecosystems.

Esta es una vista previa del contenido de la suscripción, acceda a través de su institución.


CONCLUSIONES

We have shown proof-of-principle of a hybrid SBS/SBL biochemistry called CycLiC. Gel experiments show that the ligation and cleavage mechanism is effective and can lead to high reaction completion. Notably, we have also shown that a microarray probe can be used to capture a template which can then be subjected to CycLiC to read up to three contiguous bases. A range of further optimization studies should be conducted, including how to retain the template-primer duplex in place after capture in order to extend the sequence read further. CycLiC on microarrrays uses ‘generic’ commercially available enzymes, common oligonucleotide modifications and standard microarrays and because the read will be from a targeted genomic location, sequence re-assembly algorithms will not be necessary. The method will therefore be amenable to adaptation and improvement by a community of users for sequencing as much or as little as desired from any genome for which a reference sequence is available.


Ver el vídeo: Microarray a cDNA (Diciembre 2021).