Saltar al contenido principal
LibreTexts Español

16.4: Clasificación Tumoral con SVMs

  • Page ID
    54905
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    Un enfoque genérico para clasificar dos tipos de leucemias agudas leucemia mieloide aguda (LMA) y leucemia linfoide aguda (LLA) fue presentado por Golub et al. [4]. Este enfoque se centró en abordar de manera efectiva tres cuestiones principales:

    1. Si había genes cuyo patrón de expresión a predecir estaba fuertemente correlacionado con la distinción de clase (es decir, se pueden distinguir LLA y LMA)
    2. Cómo usar una colección de muestras conocidas para crear un “predictor de clase” capaz de asignar una nueva muestra a una de dos clases
    3. Cómo probar la validez de sus predictores de clase

    Abordaron (1) utilizando una técnica de “análisis de vecindad” para establecer si las correlaciones observadas eran más fuertes de lo que se esperaría por casualidad. Este análisis mostró que aproximadamente 1100 genes estaban más altamente correlacionados con la distinción de clase AML-ALL de lo que se esperaría por casualidad. Para abordar (2) desarrollaron un procedimiento que utiliza un subconjunto fijo de “genes informativos” (elegidos en base a su correlación con la distinción de clase de AML y ALL) y hace una predicción basada en el nivel de expresión de estos genes en una nueva muestra. Cada gen informativo emite un “voto ponderado” para una de las clases, con el peso de cada voto dependiente del nivel de expresión en la nueva muestra y el grado de correlación de esos genes con la distinción de clase. Se suman los votos para determinar la clase ganadora. Abordar (3) y probar efectivamente su predictor primero probando mediante validación cruzada en el conjunto de datos inicial y luego evaluando su precisión en un conjunto independiente de muestras. Con base en sus pruebas, pudieron identificar 36 de las 38 muestras (¡que formaban parte de su set de entrenamiento!) y las 36 predicciones fueron clínicamente correctas. En el conjunto de pruebas independientes 29 de 34 muestras se predijeron fuertemente con una precisión del 100% y 5 no se predijeron.

    Un enfoque SVM para este mismo problema de clasificación fue implementado por Mukherjee et al. [5]. La salida de SVM clásica es una designación de clase binaria. En esta aplicación particular es particularmente importante poder rechazar puntos para los que el clasificador no tiene la suficiente confianza. Por lo tanto, los autores introdujeron un intervalo de confianza en la salida del SVM que permite el rechazo de puntos con valores de confianza bajos. Como en el caso de Golub et al. [4] fue importante para los autores inferir qué genes son importantes para la clasificación. El SVM se entrenó en las 38 muestras del conjunto de entrenamiento y se probó en las 34 muestras en el conjunto de prueba independiente (exactamente en el caso de Golub et al.). Los resultados de los autores se resumen en la siguiente tabla (donde |d| corresponde al punto de corte para rechazo).

    Esto da como resultado una mejora significativa con respecto a las técnicas reportadas anteriormente, lo que sugiere que las SVM juegan un papel importante en la clasificación de grandes conjuntos de datos (como los generados por experimentos de microarrays de ADN).


    This page titled 16.4: Clasificación Tumoral con SVMs is shared under a CC BY-NC-SA 4.0 license and was authored, remixed, and/or curated by Manolis Kellis et al. (MIT OpenCourseWare) via source content that was edited to the style and standards of the LibreTexts platform; a detailed edit history is available upon request.