La secuenciación de ARN unicelular (scRNA-seq) es una tecnología de secuenciación de alto rendimiento realizada a nivel de una célula individual, que puede tener un potencial para comprender la heterogeneidad celular. Sin embargo, los datos de scRNA-seq son datos altamente dimensionales, ruidosos y dispersos. La reducción dimensional es un paso importante en el análisis posterior de scRNA-seq. Por lo tanto, se han desarrollado varios métodos de reducción dimensional. Desarrollamos una estrategia para evaluar la estabilidad, precisión y coste computacional de 10 métodos de reducción dimensional utilizando 30 conjuntos de datos de simulación y cinco conjuntos de datos reales. Además, investigamos la sensibilidad de todos los métodos al ajuste de hiperparámetros y ofrecimos a los usuarios sugerencias adecuadas. Descubrimos que la incrustación estocástica de vecinos distribuida en t (t-SNE) ofrecía el mejor rendimiento global, con la mayor precisión y el mayor coste computacional. Por su parte, la aproximación y proyección uniforme de múltiples (UMAP) mostró la mayor estabilidad, así como una precisión moderada y el segundo mayor coste computacional. UMAP preserva bien la cohesión y separación originales de las poblaciones celulares. Además, cabe señalar que los usuarios deben establecer los hiperparámetros de acuerdo con la situación específica antes de utilizar los métodos de reducción de la dimensionalidad basados en modelos no lineales y redes neuronales.
https://www.frontiersin.org/articles/10.3389/fgene.2021.646936/full
No hay comentarios:
Publicar un comentario