Saltar al contenido principal
LibreTexts Español

5.4: Alineación del Genoma Completo

  • Page ID
    54117
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    \( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)

    ( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\id}{\mathrm{id}}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\kernel}{\mathrm{null}\,}\)

    \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\)

    \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\)

    \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    \( \newcommand{\vectorA}[1]{\vec{#1}}      % arrow\)

    \( \newcommand{\vectorAt}[1]{\vec{\text{#1}}}      % arrow\)

    \( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vectorC}[1]{\textbf{#1}} \)

    \( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)

    \( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)

    \( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)

    \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    \(\newcommand{\avec}{\mathbf a}\) \(\newcommand{\bvec}{\mathbf b}\) \(\newcommand{\cvec}{\mathbf c}\) \(\newcommand{\dvec}{\mathbf d}\) \(\newcommand{\dtil}{\widetilde{\mathbf d}}\) \(\newcommand{\evec}{\mathbf e}\) \(\newcommand{\fvec}{\mathbf f}\) \(\newcommand{\nvec}{\mathbf n}\) \(\newcommand{\pvec}{\mathbf p}\) \(\newcommand{\qvec}{\mathbf q}\) \(\newcommand{\svec}{\mathbf s}\) \(\newcommand{\tvec}{\mathbf t}\) \(\newcommand{\uvec}{\mathbf u}\) \(\newcommand{\vvec}{\mathbf v}\) \(\newcommand{\wvec}{\mathbf w}\) \(\newcommand{\xvec}{\mathbf x}\) \(\newcommand{\yvec}{\mathbf y}\) \(\newcommand{\zvec}{\mathbf z}\) \(\newcommand{\rvec}{\mathbf r}\) \(\newcommand{\mvec}{\mathbf m}\) \(\newcommand{\zerovec}{\mathbf 0}\) \(\newcommand{\onevec}{\mathbf 1}\) \(\newcommand{\real}{\mathbb R}\) \(\newcommand{\twovec}[2]{\left[\begin{array}{r}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\ctwovec}[2]{\left[\begin{array}{c}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\threevec}[3]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\cthreevec}[3]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\fourvec}[4]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\cfourvec}[4]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\fivevec}[5]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\cfivevec}[5]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\mattwo}[4]{\left[\begin{array}{rr}#1 \amp #2 \\ #3 \amp #4 \\ \end{array}\right]}\) \(\newcommand{\laspan}[1]{\text{Span}\{#1\}}\) \(\newcommand{\bcal}{\cal B}\) \(\newcommand{\ccal}{\cal C}\) \(\newcommand{\scal}{\cal S}\) \(\newcommand{\wcal}{\cal W}\) \(\newcommand{\ecal}{\cal E}\) \(\newcommand{\coords}[2]{\left\{#1\right\}_{#2}}\) \(\newcommand{\gray}[1]{\color{gray}{#1}}\) \(\newcommand{\lgray}[1]{\color{lightgray}{#1}}\) \(\newcommand{\rank}{\operatorname{rank}}\) \(\newcommand{\row}{\text{Row}}\) \(\newcommand{\col}{\text{Col}}\) \(\renewcommand{\row}{\text{Row}}\) \(\newcommand{\nul}{\text{Nul}}\) \(\newcommand{\var}{\text{Var}}\) \(\newcommand{\corr}{\text{corr}}\) \(\newcommand{\len}[1]{\left|#1\right|}\) \(\newcommand{\bbar}{\overline{\bvec}}\) \(\newcommand{\bhat}{\widehat{\bvec}}\) \(\newcommand{\bperp}{\bvec^\perp}\) \(\newcommand{\xhat}{\widehat{\xvec}}\) \(\newcommand{\vhat}{\widehat{\vvec}}\) \(\newcommand{\uhat}{\widehat{\uvec}}\) \(\newcommand{\what}{\widehat{\wvec}}\) \(\newcommand{\Sighat}{\widehat{\Sigma}}\) \(\newcommand{\lt}{<}\) \(\newcommand{\gt}{>}\) \(\newcommand{\amp}{&}\) \(\definecolor{fillinmathshade}{gray}{0.9}\)

    Una vez que tenemos acceso a secuencias del genoma completo para varias especies diferentes, podemos intentar alinearlas para inferir el camino que tomó la evolución para diferenciar estas especies. En esta sección discutimos algunos de los métodos para realizar alineaciones de genoma completo entre múltiples especies.

    Alineación global, local y 'glocal'

    El algoritmo de Needleman-Wunsch discutido en el capítulo 2 es la mejor manera de generar un alineamiento óptimo entre dos o más secuencias genómicas de tamaño limitado. A nivel de genomas completos, sin embargo, el límite de tiempo O (n 2) no es práctico. Además, para encontrar un alineamiento óptimo entre k especies diferentes, el tiempo para el algoritmo de Needleman-Wunsch se extiende a O (n k). Para genomas que tienen millones de bases de largo, este tiempo de ejecución es prohibitivo (Figura 5.15).

    page121image53728128.png
    © fuente desconocida. Todos los derechos reservados. Este contenido está excluido de nuestra licencia Creative Commons. Para obtener más información, consulte http://ocw.mit.edu/help/faq-fair-use/.

    Figura 5.15: El algoritmo de Needleman-Wunsch para alineaciones de 2 y 3 genomas

    Una alternativa es usar una herramienta de alineación local eficiente como BLAST para encontrar todas las alineaciones locales y luego encadenarlas a lo largo de la diagonal para formar alineaciones globales. Este enfoque puede ahorrar una cantidad significativa de tiempo, ya que el proceso de búsqueda de alineaciones locales es muy eficiente, y entonces solo necesitamos realizar el algoritmo de Needleman-Wunsch que consume mucho tiempo en los pequeños rectángulos entre alineaciones locales (Figura 5.16).

    page121image53727920.png
    © fuente desconocida. Todos los derechos reservados. Este contenido está excluido de nuestra licencia Creative Commons. Para obtener más información, consulte http://ocw.mit.edu/help/faq-fair-use/.

    Figura 5.16: Podemos ahorrar tiempo al realizar una alineación global al encontrar primero todas las alineaciones locales y luego encadenarlas a lo largo de la diagonal con programación dinámica restringida.

    Otro enfoque novedoso para el alineamiento del genoma completo es extender la búsqueda de alineamiento local para incluir inversiones, duplicaciones y translocaciones. Entonces podemos encadenar estos elementos usando las transformaciones de menor costo entre secuencias. Este enfoque se denomina comúnmente alineación glocal, ya que busca combinar lo mejor de la alineación local y global para crear la imagen más precisa de cómo evolucionan los genomas a lo largo del tiempo (Figura 5.17).

    Lagan: Encadenamiento de alineaciones locales

    LAGAN es un popular kit de herramientas de software que incorpora muchas de las ideas anteriores y se puede utilizar para alineaciones locales, globales, glocales y múltiples entre especies.

    page122image53733744.png
    © fuente desconocida. Todos los derechos reservados. Este contenido está excluido de nuestra licencia Creative Commons. Para obtener más información, consulte http://ocw.mit.edu/help/faq-fair-use/.

    Figura 5.17: La alineación glocal permite la posibilidad de duplicaciones, inversiones y translocaciones.

    El algoritmo LAGAN regular consiste en encontrar alineaciones locales, encadenar alineaciones locales a lo largo de la diagonal y luego realizar programación dinámica restringida para encontrar la ruta óptima entre alineaciones locales.

    Multi-lagan utiliza el mismo enfoque que el LAGAN regular pero lo generaliza a la alineación de múltiples especies. En este algoritmo, el usuario debe proporcionar un conjunto de genomas y un árbol filogenético correspondiente. Multi- LAGAN realiza alineamiento por pares guiado por el árbol filogenético. Primero compara especies altamente relacionadas, y luego compara iterativamente especies cada vez más distantes.

    Shuffle-lagan es una herramienta de alineación glocal que encuentra alineaciones locales, construye un mapa de homología aproximado y luego alinea globalmente cada una de las partes consistentes (Figura 5.18). Para construir un mapa de homología, el algoritmo elige el subconjunto de puntuación máxima de alineaciones locales en función de ciertas penalizaciones de brecha y transformación, que forman una cadena no decreciente en al menos una de las dos secuencias. A diferencia del LAGAN regular, todas las secuencias de alineación local posibles se consideran como pasos en el alineamiento glocal, ya que podrían representar translocaciones, inversiones y translocaciones invertidas, así como secuencias regulares no transformadas. Una vez que se ha construido el mapa de homología aproximado, el algoritmo divide las regiones homólogas en trozos de alineaciones locales que están aproximadamente a lo largo de la misma ruta continua. Finalmente, se aplica el algoritmo LAGAN a cada fragmento para vincular las alineaciones locales mediante programación dinámica restringida.

    Al ejecutar Shuffle-lagan u otras herramientas de alineación glocal, podemos descubrir inversiones, translocaciones y otras relaciones homólogas entre diferentes especies. Al mapear las conexiones entre estos rangos traseros, podemos obtener una idea de cómo evolucionó cada especie a partir del ancestro común (Figura 5.19).


    This page titled 5.4: Alineación del Genoma Completo is shared under a CC BY-NC-SA 4.0 license and was authored, remixed, and/or curated by Manolis Kellis et al. (MIT OpenCourseWare) via source content that was edited to the style and standards of the LibreTexts platform.