Saltar al contenido principal
Library homepage
 
LibreTexts Español

7.2: Motivación

  • Page ID
    54281
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    Tienes una nueva secuencia de ADN, ¿y ahora qué?

    1. Alinear:
      • con cosas que conocemos (búsqueda en bases de datos).
      • con cosas desconocidas (montar/clustering)
    2. Visualízala: “Regla genómica #1”: ¡Mira tus datos!
      • Busque composiciones de nucleótidos no estándar.
      • Busque frecuencias k-mer que estén asociadas con regiones codificadoras de proteínas, datos recurrentes, alto contenido de GC, etc.
      • Busca motivos, firmas evolutivas.
      • Traducir y buscar marcos abiertos de lectura, codones de parada, etc.
      • Busque patrones, luego desarrolle herramientas de aprendizaje automático para determinar modelos probabilísticos razonables. Por ejemplo, al observar una serie de cuatriples decidimos codificarlos por colores para ver dónde ocurren con mayor frecuencia.
    3. Modelarlo:
      1. Hacer hipótesis.
      2. Construir un modelo generativo para describir la hipótesis.
      3. Usa ese modelo para encontrar secuencias de tipo similar.

    No estamos buscando secuencias que necesariamente tengan ancestros comunes. Más bien, nos interesan secuencias con propiedades similares. En realidad no sabemos modelar genomas enteros, pero podemos modelar pequeños aspectos de genomas. La tarea requiere comprender todas las propiedades de las regiones genómicas y construir computacionalmente modelos generativos para representar hipótesis. Para una secuencia dada, queremos anotar regiones ya sean intrones, exones, intergénicas, promotoras o regiones clasificables de otro modo.

    page149image19597968.png
    Figura 7.1: Modelado de secuencias biológicas © fuente desconocida. Todos los derechos reservados. Este contenido está excluido de nuestra licencia Creative Commons. Para obtener más información, consulte http://ocw.mit.edu/help/faq-fair-use/.

    Construir este marco nos dará la capacidad de:

    • Emitir (generar) secuencias de tipo similar según el modelo generativo
    • Reconocer el estado oculto que probablemente ha generado la observación
    • Aprenda (entrene) grandes conjuntos de datos y aplique tanto a datos etiquetados previamente (aprendizaje supervisado) como a datos no etiquetados (aprendizaje no supervisado).

    En esta conferencia se discuten algoritmos de emisión y reconocimiento.

    ¿Por qué modelar secuencias probabilísticas?

    • Los datos biológicos son ruidosos.
    • Actualizar conocimientos previos sobre secuencias biológicas.
    • La probabilidad proporciona un cálculo para manipular modelos.
    • No limitado a respuestas sí/no, puede proporcionar grados de creencia.
    • Muchas herramientas computacionales comunes se basan en modelos probabilísticos.
    • Nuestras herramientas: Cadenas Markov y HMM.

    This page titled 7.2: Motivación is shared under a CC BY-NC-SA 4.0 license and was authored, remixed, and/or curated by Manolis Kellis et al. (MIT OpenCourseWare) via source content that was edited to the style and standards of the LibreTexts platform; a detailed edit history is available upon request.