Una nueva investigación liderada por Holger Heyn en el
Centro Nacional de Análisis Genómico del Centro de Regulación Genómica
(CNAG-CRG) presenta un sofisticado marco computacional para analizar los
niveles de expresión génica de células individuales, escalable para procesar
millones de células individuales. El trabajo, publicado en la edición actual de
la revista científica Genome Research, muestra por primera vez una herramienta
capaz de analizar ese gran conjunto de datos RNAseq de células individuales.
Esto extiende drásticamente los límites de la investigación del genoma de una
sola célula.
Todas las células de un cuerpo humano comparten el mismo
genoma, pero cada célula tiene el potencial de volverse específica en un tejido
u órgano debido a la expresión génica. Los científicos de todo el mundo están
estudiando qué diferencia una célula de otra. Uno de los desafíos actuales de
la investigación del genoma es analizar muchas células individuales para
encontrar e identificar esas diferencias. El análisis de células individuales
mediante la secuenciación de ARN de células individuales ha sido crucial para
enfrentar este desafío y ha revolucionado nuestra comprensión de la complejidad
de los tejidos, órganos y organismos. Al observar la expresión génica de una
célula a la vez, los científicos ahora pueden describir la heterogeneidad de
una muestra a una resolución sin precedentes y sin conocimiento previo de su
composición.
En consecuencia, los proyectos de células individuales a
gran escala condujeron a la identificación de tipos de células previamente
desconocidos y al diseño de mapas celulares completos de organismos. En el
marco del proyecto Human Cell Atlas, los investigadores tienen como objetivo
crear un atlas de todos los tipos de células que componen un cuerpo humano. Sin
embargo, tales estudios crean cantidades masivas de datos de secuenciación y el
análisis de grandes conjuntos de datos es un desafío importante.
Un grupo de científicos del CNAG-CRG, en colaboración con
investigadores de la Universidad Pompeu Fabra (UPF) y del Consorcio Español de
Investigación Biomédica en Enfermedades Raras (CIBERER), ha desarrollado un
marco computacional eficiente que permite el procesamiento, análisis e
interpretación de tales experimentos de una sola célula a gran escala. El grupo
ilustró el poder de su estrategia mediante el análisis de uno de los estudios
más grandes de células individuales con 1,3 millones de células individuales
del cerebro de ratón en desarrollo.
"BigSCale es extremadamente poderoso en la
identificación de genes específicos del tipo de célula, lo que ayuda mucho en
la interpretación posterior de los experimentos", dice Holger Heyn, líder
del equipo CNAG-CRG y autor principal del estudio. La novedad de la herramienta
analítica llamada "BigSCale" radica en un modelo numérico que
determina con sensibilidad las diferencias entre células individuales. Después
de haber trazado cómo las células individuales difieren entre sí, se pueden
agrupar en poblaciones de células para describir la complejidad celular de un
tejido determinado. Como virtualmente todos los tejidos están compuestos de
diferentes tipos y subtipos de células, dicho análisis puede guiar una
caracterización exhaustiva e imparcial sin hipótesis iniciales. Los genes
marcadores expresados de forma diferencial entre la subpoblación ayudan al
investigador a vincular las células con el conocimiento previo sobre la
anatomía del tejido o a describir las funciones de los tipos de células recién
descubiertos.
Además, la herramienta fue diseñada para enfrentar los
desafíos futuros de grandes conjuntos de datos. "Los costos para obtener
perfiles unicelulares están disminuyendo y estamos viendo estudios sobre el
aumento del número de células", agrega el Dr. Heyn. En este sentido, un
módulo en el flujo de trabajo de BigSCale permite el análisis de millones de
células a través de una estrategia de convolución dirigida. Aquí, los
transcriptomes de célula única de células similares se fusionan en celdas de
índice, lo que reduce en gran medida la cantidad de datos que se procesarán.
Con la nueva herramienta en mano, el grupo analizó uno de
los mayores conjuntos de datos de expresión de células individuales de 1.3
millones de células, un recurso disponible públicamente de 10x Genomics.
"BigSCale nos permitió mirar a fondo en los procesos de desarrollo del
cerebro del ratón y caracterizar incluso los tipos de células neuronales
raras", comentó Giovanni Iacono, el primer autor del trabajo.
Específicamente, la gran cantidad de células permitió al grupo acercarse a una
pequeña población de células transitorias llamadas células Cajal-Retzius y
describir las principales subestructuras relacionadas con distintas etapas de
diferenciación, organización espacial y función celular. "El marco
BigSCale proporciona una solución poderosa para prácticamente cualquier especie
e incluso es aplicable fuera del contexto de secuenciación del ARN",
explica el Dr. Heyn y agrega: "Esperamos que contribuya a la
interpretación de estudios a gran escala, como el proyecto Human Cell Atlas
".
Comments
Post a Comment