Saltar al contenido principal
LibreTexts Español

18.2: Descubrimiento de Motivos De Novo

  • Page ID
    54780
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    Descubrimiento de Motivos

    Los factores de transcripción influyen en la expresión de genes diana como activadores o represores al unirse al ADN cerca de genes. Esta unión está guiada por la especificidad de la secuencia de TF. Cuanto más cerca esté el ADN de la preferencia de base, más probable es que el factor se una. Estos motivos se pueden encontrar tanto computacional como experimentalmente. Existen tres enfoques principales para descubrir estos motivos.

    • Corregulación - En la Conferencia 11, discutimos un tipo de corregulación de descubrimiento de motivos mediante la búsqueda de secuencias que probablemente tengan el motivo unido. Luego podemos usar enfoques enumerativos o métodos de alineación para encontrar estos motivos en las regiones aguas arriba. Podemos aplicar técnicas similares a datos experimentales donde se sabe dónde se une el motivo.
    • Factor Centric - También hay métodos centrados en factores para descubrir motivos. Estos son en su mayoría métodos experimentales que requieren una proteína o anticuerpo. Los ejemplos incluyen SELEX, DIP-chip y PBMs. Todos estos métodos son in vitro.
    • Evolutivo - En lugar de centrarse en un solo factor, los métodos evolutivos se enfocan en todos los factores. Podemos comenzar por mirar un solo factor y determinar qué propiedades podemos explotar. Hay ciertas secuencias que se conservan preferentemente (islas de conservación). Sin embargo, estos no siempre son motivos y en cambio pueden deberse a la conservación casual o no de motivos. Luego podemos observar muchas regiones, encontrar motivos más conservados y determinar cuáles están más conservados en general. Al probar la conservación en muchas regiones a través de muchos genomas, aumentamos el poder. Estos motivos tienen ciertas firmas evolutivas que nos ayudan a identificarlos: los motivos están más conservados en regiones intergénicas que en regiones codificantes, es más probable que los motivos estén aguas arriba de un gen que aguas abajo. Este es un método para tomar un motivo conocido y probar si se conserva.

    Ahora queremos encontrar todo lo que esté más conservado de lo esperado. Esto se puede hacer usando un enfoque de escalada en colina. Comenzamos por enumerar las semillas del motivo, que suelen estar en forma de 3-gap-3. Luego, cada una de estas semillas es puntuada y clasificada usando una relación de conservación corregida por composición y pequeños recuentos. Estas semillas se expanden luego para llenar bases no especificadas alrededor de la semilla usando escalada en colinas. A través de estos métodos, es posible llegar a semillas iguales, o muy similares de diferentes maneras. Así, nuestro paso final consiste en agrupar las semillas usando similitud de secuencia para eliminar redundancia.

    Un método final que podemos utilizar es registrar la frecuencia con la que una secuencia es reemplazada por otra en evolución. Esto produce racimos de k-meros que corresponden a un solo motivo.

    Validación de motivos descubiertos

    Hay muchas formas en las que podemos validar motivos descubiertos. En primer lugar, esperamos que coincidan con motivos reales, lo que ocurre significativamente más a menudo que con motivos aleatorios. Sin embargo, esto no es un acuerdo perfecto, posiblemente debido a que muchos motivos conocidos no se conservan y que los motivos conocidos están sesgados y pueden haber perdido motivos reales. Sesgo posicional. Sesgado hacia el TSS,

    Los motivos también tienen enriquecimientos funcionales. Si un TF específico se expresa en un tejido, entonces esperamos que la región aguas arriba tenga el motivo de ese factor. Esto también revela módulos de motivos cooperantes. También vemos que la mayoría de los motivos se evitan en genes expresados ubicuamente, de manera que no se encienden y apagan aleatoriamente.

    Resumen

    Hay desventajas en todos estos enfoques. Tanto los enfoques TF como los centrados en la región no son integrales y están sesgados. Los enfoques centrados en TF requieren un factor de transcripción o anticuerpo, requieren mucho tiempo y dinero, y también tienen desafíos computacionales. El descubrimiento de novo utilizando la conservación es imparcial, pero no puede hacer coincidir los motivos con los factores y requiere múltiples genomas.


    This page titled 18.2: Descubrimiento de Motivos De Novo is shared under a CC BY-NC-SA 4.0 license and was authored, remixed, and/or curated by Manolis Kellis et al. (MIT OpenCourseWare) via source content that was edited to the style and standards of the LibreTexts platform; a detailed edit history is available upon request.