Saltar al contenido principal
LibreTexts Español

Sección 2: Caracterización

  • Page ID
    54894
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    Para cada tumor, nuestro objetivo es obtener una caracterización completa y a nivel básico de ese tumor, su historia evolutiva y los mecanismos que lo configuraron. Podemos usar secuenciación masivamente paralela para obtener la caracterización del genoma a nivel base, pero este enfoque trae consigo algunos desafíos asociados.

    1. Cantidades masivas de datos El principal desafío con el aumento de las cantidades de datos es un aumento en la potencia computacional requerida para analizar estos datos, así como los costos de almacenamiento asociados con el seguimiento de todos los genomas secuenciados. También se necesita un pipeline de análisis (automatizado, estandarizado, reproducible) para tener hallazgos consistentes en los diferentes esfuerzos de caracterización. Finalmente, necesitamos encontrar nuevas formas de visualizar y reportar datos a gran escala.
    2. Sensibilidad/Especificidad La caracterización del cáncer comienza con la identificación adecuada de las mutaciones SNP presentes en las células cancerosas, y la eliminación máxima de lecturas falsas positivas. Al seleccionar muestras tumorales, el ADN extraído es una mezcla de genomas normales y genomas tumorales complejos. La fracción alélica mutacional (la fracción de moléculas de ADN de un locus que porta una mutación), se utiliza para estudiar la significación de una mutación y su prevalencia en el subtipo de cáncer. Esta fracción depende de la pureza, el número de copias locales, la multiplicidad de la muestra tumoral y la fracción de células cancerosas (CCF, cantidad de células cancerosas que portan la mutación). Las mutaciones clonales son portadas por todas las células cancerosas, y las mutaciones subclonales son portadas por un subconjunto de las células tumorales.

    Además de detectar la presencia de mutaciones clonales y subclonales, el análisis adecuado requiere la eliminación de eventos mutagénicos falsos positivos. Dos tipos de falsos positivos incluyen errores de secuenciación y mutaciones de la línea germinal. Los errores de secuenciación pueden provenir de bases mal leídas, artefactos de secuenciación y lecturas desalineadas, mientras que las mutaciones de la línea germinal generalmente ocurren en lugares predecibles del genoma (1000/MB conocidos, novela 10-20/MB). Al tener múltiples lecturas de la misma secuencia, la probabilidad de errores repetidos en la secuenciación disminuye rápidamente, y al saber en qué parte del genoma es probable una mutación de la línea germinal, un filtro puede corregir la probabilidad de falsos positivos adicionales. La sensibilidad general de detectar variaciones de un solo nucleótido depende de la frecuencia de mutaciones de fondo y del número de lecturas alternativas.

    Un tercer tipo de falso positivo puede provenir de la contaminación cruzada del paciente si la muestra del tumor contiene ADN de otra persona. ConTEST es un método para detectar con precisión la contaminación por comparación con una matriz SNP.

    Un llamador de mutaciones es un clasificador preguntando en cada locus genómico, ¿Hay alguna mutación aquí?. Estos clasificadores se evalúan utilizando muchas curvas de Característica de Operadores Receptores (ROC), que dependen de la fracción alélica, cobertura de tumor y muestra normal, y ruido de secuenciación y alineación. MutECt es un llamador de mutación somática altamente sensible. El pipeline MutECT es el siguiente: Las muestras tumorales y normales se pasan a un estadístico de detección de variantes (que compara el modelo variante con la hipótesis nula), que se pasa a través de filtros basados en sitio (brecha proximal, sesgo de hebra, mapeo deficiente, sitio trialélico, posición agrupada, observada en control), luego se compararon con un panel de muestras normales, y finalmente se clasificaron como variantes candidatas. MutECT puede detectar mutaciones de fracción alélica baja y, por lo tanto, es adecuado para estudiar tumores impuros y heterogéneos.

    3. Descubriendo procesos mutacionales

    En lugar de detectar la presencia de mutaciones en los genes del cáncer, un enfoque diferente podría ser descubrir si hubiera patrones específicos entre mutaciones en las muestras de cáncer. Una “trama de Lego” es una forma de visualizar patrones de mutaciones, en la que las alturas de cada uno de los colores representan frecuencias de los 6 tipos de sustituciones de pares de bases, y la frecuencia de cada una se grafica en relación con los 16 contextos diferentes en los que podría ocurrir esta mutación (nucleótidos vecinos). Los tipos específicos de eventos mutagénicos en cada tipo de cáncer pueden representarse y analizarse. Como ejemplo, se encuentra un nuevo patrón de mutación (AA ¿AC) en el cáncer de esófago. Los cánceres pueden agruparse por estos espectros mutacionales específicos. Las reducciones de dimensionalidad usando factorización matricial no negativa (NMF) de datos de parcelas lego se pueden usar para identificar firmas espectrales fundamentales.

    4. Estimación de la pureza, la ploidía y las funciones de las células cancerosas

    Además de detectar mutaciones en células cancerosas, eliminar falsos positivos y detectar patrones de mutaciones, se requiere una caracterización adecuada de cada muestra tumoral. Debido a la heterogeneidad e impurezas de la muestra, es necesario estimar la pureza, el número absoluto de copias y la fracción de células cancerosas (CCF) de la muestra tumoral que se está secuenciando para obtener el número total correcto y la prevalencia de los alelos mutados.

    5. Heterogeneidad y evolución tumoral

    Las muestras pueden tener grandes distribuciones de mutaciones puntuales y alteraciones del número de copias, pero un algoritmo de agrupamiento bayesiano puede ayudar a identificar las mutaciones y alteraciones del número de copias en distintas subpoblaciones.


    Sección 2: Caracterización is shared under a not declared license and was authored, remixed, and/or curated by LibreTexts.