9.12: Localización de información dentro del ADN
- Page ID
- 53353
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)
\( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)
( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)
\( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)
\( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)
\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)
\( \newcommand{\Span}{\mathrm{span}}\)
\( \newcommand{\id}{\mathrm{id}}\)
\( \newcommand{\Span}{\mathrm{span}}\)
\( \newcommand{\kernel}{\mathrm{null}\,}\)
\( \newcommand{\range}{\mathrm{range}\,}\)
\( \newcommand{\RealPart}{\mathrm{Re}}\)
\( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)
\( \newcommand{\Argument}{\mathrm{Arg}}\)
\( \newcommand{\norm}[1]{\| #1 \|}\)
\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)
\( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)
\( \newcommand{\vectorA}[1]{\vec{#1}} % arrow\)
\( \newcommand{\vectorAt}[1]{\vec{\text{#1}}} % arrow\)
\( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vectorC}[1]{\textbf{#1}} \)
\( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)
\( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)
\( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)
\(\newcommand{\avec}{\mathbf a}\) \(\newcommand{\bvec}{\mathbf b}\) \(\newcommand{\cvec}{\mathbf c}\) \(\newcommand{\dvec}{\mathbf d}\) \(\newcommand{\dtil}{\widetilde{\mathbf d}}\) \(\newcommand{\evec}{\mathbf e}\) \(\newcommand{\fvec}{\mathbf f}\) \(\newcommand{\nvec}{\mathbf n}\) \(\newcommand{\pvec}{\mathbf p}\) \(\newcommand{\qvec}{\mathbf q}\) \(\newcommand{\svec}{\mathbf s}\) \(\newcommand{\tvec}{\mathbf t}\) \(\newcommand{\uvec}{\mathbf u}\) \(\newcommand{\vvec}{\mathbf v}\) \(\newcommand{\wvec}{\mathbf w}\) \(\newcommand{\xvec}{\mathbf x}\) \(\newcommand{\yvec}{\mathbf y}\) \(\newcommand{\zvec}{\mathbf z}\) \(\newcommand{\rvec}{\mathbf r}\) \(\newcommand{\mvec}{\mathbf m}\) \(\newcommand{\zerovec}{\mathbf 0}\) \(\newcommand{\onevec}{\mathbf 1}\) \(\newcommand{\real}{\mathbb R}\) \(\newcommand{\twovec}[2]{\left[\begin{array}{r}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\ctwovec}[2]{\left[\begin{array}{c}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\threevec}[3]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\cthreevec}[3]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\fourvec}[4]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\cfourvec}[4]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\fivevec}[5]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\cfivevec}[5]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\mattwo}[4]{\left[\begin{array}{rr}#1 \amp #2 \\ #3 \amp #4 \\ \end{array}\right]}\) \(\newcommand{\laspan}[1]{\text{Span}\{#1\}}\) \(\newcommand{\bcal}{\cal B}\) \(\newcommand{\ccal}{\cal C}\) \(\newcommand{\scal}{\cal S}\) \(\newcommand{\wcal}{\cal W}\) \(\newcommand{\ecal}{\cal E}\) \(\newcommand{\coords}[2]{\left\{#1\right\}_{#2}}\) \(\newcommand{\gray}[1]{\color{gray}{#1}}\) \(\newcommand{\lgray}[1]{\color{lightgray}{#1}}\) \(\newcommand{\rank}{\operatorname{rank}}\) \(\newcommand{\row}{\text{Row}}\) \(\newcommand{\col}{\text{Col}}\) \(\renewcommand{\row}{\text{Row}}\) \(\newcommand{\nul}{\text{Nul}}\) \(\newcommand{\var}{\text{Var}}\) \(\newcommand{\corr}{\text{corr}}\) \(\newcommand{\len}[1]{\left|#1\right|}\) \(\newcommand{\bbar}{\overline{\bvec}}\) \(\newcommand{\bhat}{\widehat{\bvec}}\) \(\newcommand{\bperp}{\bvec^\perp}\) \(\newcommand{\xhat}{\widehat{\xvec}}\) \(\newcommand{\vhat}{\widehat{\vvec}}\) \(\newcommand{\uhat}{\widehat{\uvec}}\) \(\newcommand{\what}{\widehat{\wvec}}\) \(\newcommand{\Sighat}{\widehat{\Sigma}}\) \(\newcommand{\lt}{<}\) \(\newcommand{\gt}{>}\) \(\newcommand{\amp}{&}\) \(\definecolor{fillinmathshade}{gray}{0.9}\)Entonces dado que los genes existen dentro de un genoma, para que sean útiles se necesitan mecanismos mediante los cuales genes específicos puedan ser reconocidos y expresados (transcritos) 282. El reconocimiento de genes implica un sistema de dos componentes que consiste en secuencias de nucleótidos reguladoras que proporcionan una dirección molecular que identifica una región específica de una molécula de ADN, así como qué cadena específica del ADN debe transcribirse. El segundo componente son proteínas que reconocen (y se unen a) secuencias de ADN específicas. La región reguladora de un gen puede ser simple y relativamente corta o larga y compleja. En algunos genes humanos, la región reguladora se extiende sobre miles de pares de bases de ADN, ubicados “aguas arriba” o “aguas abajo” de y dentro de la región codificante 283. Esto es posible porque, a larga distancia y en asociación con proteínas, el ADN puede plegarse sobre sí mismo.
Las proteínas que se unen a secuencias reguladoras se conocen como factores de transcripción 284. En estudios genéticos tempranos, se encontraron dos tipos generales de mutaciones que podrían influir en la actividad de un gen. Las mutaciones “cis” se localizan cerca de la región codificadora (transcrita) del gen; son mutaciones que alteran las regiones reguladoras de las mutaciones “trans” de un gen mapeadas en otros sitios (distantes) y resultan alterar los genes que codifican los factores de transcripción involucrados en la regulación del gen diana. Los factores de transcripción pueden actuar positivamente para reclutar y activar la ARN polimerasa dependiente de ADN o negativamente, para bloquear la unión y actividad de la ARN polimerasa. También es posible que las modificaciones postraduccionales y la unión de factores alostéricos puedan alterar la actividad del factor de transcripción. El patrón de unión al factor de transcripción dentro de una región reguladora también puede influir en si un gen se expresa o no.
Los genes que reclutan y activan eficientemente la ARN polimerasa harán muchas copias del ARN transcrito y se dice que están altamente expresados. Generalmente, altos niveles de ARNm conducirán a altos niveles del polipéptido codificado. Una mutación en un gen que codifica un factor de transcripción puede influir en la expresión de muchos genes, mientras que las mutaciones en la secuencia reguladora de un gen afectarán directamente solo a su propia expresión, a menos que, por supuesto, el gen codifique un factor de transcripción o su actividad influya en los circuitos reguladores de la célula.
Las proteínas reguladoras de la transcripción reconocen secuencias de ADN específicas interactuando con los bordes de pares de bases accesibles a través de los surcos mayores o menores de la hélice de ADN. Hay una serie de diferentes tipos de factores de transcripción, dentro de dominios de unión al ADN estructuralmente distintos; pueden agruparse en varias familias (presumiblemente relacionadas evolutivamente) 285. La afinidad de unión de un factor de transcripción particular a una secuencia reguladora particular estará influenciada por la secuencia de ADN así como la unión de otras proteínas en el vecindario molecular. Podemos comparar afinidades de diferentes proteínas por diferentes sitios de unión usando un ensayo en el que moléculas cortas de ADN que contienen una secuencia de nucleótidos particular se mezclan en una relación molar 1:1, es decir, números iguales de proteínas y moléculas de ADN:
Secuencia de ADN + proteína ADN:Proteína.
Después de que la reacción de unión haya alcanzado el equilibrio podemos medir el porcentaje del ADN unido a la proteína. Si la proteína se une con alta afinidad el valor es cercano al 100%, y cercano al 0% si se une con baja afinidad. De esta manera podemos determinar empíricamente las especificidades de unión relativas (afinidad de unión por una secuencia particular) de diversas proteínas, asumiendo que podemos generar moléculas de ADN de longitud y secuencia específicas (que podemos) y purificar proteínas que permanecen correctamente plegadas en un nativo en lugar de desnaturalizado o configuración inactiva, que puede o no ser simple 286. Lo que descubrimos es que los factores de transcripción no reconocen secuencias de nucleótidos únicas, sino que tienen un rango de afinidades por secuencias relacionadas. Esta preferencia de unión es característica de cada proteína factor de transcripción; implica tanto la longitud de la secuencia de ADN reconocida como el patrón de nucleótidos dentro de esa secuencia. Un enfoque sencillo de este problema considera que la información de unión presente en cada posición de nucleótido es independiente de todas las demás en la secuencia de unión, lo que ciertamente no es precisa pero lo suficientemente cercana para la mayoría de las situaciones. Estos datos a menudo se presentan como un “logotipo de secuencia” 287. En dicha gráfica, indicamos la cantidad de información de unión en cada posición a lo largo de la longitud del sitio de unión. Donde no hay preferencia, es decir, cuando alguno de los cuatro nucleótidos sea aceptable, la información presente en ese sitio es 0. Cuando cualquiera de los dos nucleótidos es aceptable, la información es 1, y donde solo un nucleótido en particular es aceptable, el contenido de la información es 2. Diferentes proteínas del factor de transcripción producen diferentes parcelas de preferencia. Como podría predecir, las mutaciones en un sitio de unión al factor de transcripción pueden tener efectos dramáticamente diferentes. En sitios que no contienen información específica (0), una mutación no tendrá ningún efecto, mientras que en sitios de alta información (2), cualquier cambio del nucleótido preferido probablemente producirá un efecto severo sobre la afinidad de unión, y puede conducir a un cambio dramático en la expresión génica.
Esto no quiere decir que las proteínas no puedan ser extremadamente específicas en su unión a secuencias de ácidos nucleicos. Por ejemplo, existe una clase de proteínas, conocidas como endonucleasas de restricción y enzimas de modificación de ADN específicas de sitio (metilasas) que se unen a secuencias de nucleótidos únicas. Por ejemplo, la endonucleasa de restricción EcoR1 se une a (y escinde) la secuencia de nucleótidos GAATTC, cambia cualquiera de estas bases y no hay unión significativa ni escisión. Entonces, el hecho de que las especificidades de unión del factor de transcripción sean más flexibles sugiere que existe una razón para tal flexibilidad, aunque exactamente cuál es esa razón sigue siendo conjetural.
Un punto importante a quitar de esta discusión es que la mayoría de las proteínas del factor de transcripción también se unen a secuencias genéricas de ADN con baja afinidad. Esta unión “no específica de secuencia” es transitoria y tales interacciones proteína:ADN se rompen rápidamente por el movimiento térmico. Dicho esto, dado que hay un gran número de tales sitios de unión no específicos de secuencia dentro del ADN de una célula, la mayoría de las veces los factores de transcripción se encuentran transitoriamente asociados con el ADN.
Para ser eficaz en el reclutamiento de un complejo de ARN polimerasa funcional en sitios específicos a lo largo de una molécula de ADN, la unión de una proteína a una secuencia de ADN específica debe ser relativamente larga. Un enfoque común para lograr este resultado es que el factor de transcripción sea multivalente, es decir, para que se una a múltiples (típicamente dos) elementos de secuencia. Esto tiene el efecto de que si el factor de transcripción se disocia de un sitio de unión, permanece anclado al otro; dado que se mantiene cerca del ADN es más probable que se vuelva a unir a su sitio original. Por el contrario, una proteína con un único sitio de unión es más probable que se difunda antes de que pueda ocurrir la reunión. Un comportamiento relacionado que implica la unión de baja afinidad de las proteínas al ADN es que conduce a la difusión unidimensional a lo largo de la longitud de la molécula de ADN unida 288. Esto permite que una proteína factor de transcripción se una al ADN y luego se mueva hacia adelante y hacia atrás a lo largo de la molécula de ADN hasta que interactúe y se una a un sitio de alta afinidad (o hasta que se disocie por completo). Este tipo de comportamiento de “búsqueda de objetivos facilitados” puede reducir en gran medida el tiempo que tarda una proteína en encontrar un sitio de unión de alta afinidad entre millones de sitios de baja afinidad presentes en el genoma 289.
A medida que las condiciones en las que vive un organismo se vuelven más complejas, es necesario que sea la expresión génica más dinámica. Este es particularmente el caso en eucariotas multicelulares, donde diferentes tipos de células necesitan expresar diferentes genes, o diferentes versiones (variantes de empalme) de genes. Un enfoque es tener diferentes regiones reguladoras génicas, que se unan a diferentes conjuntos de factores de transcripción. Tales factores reguladores no sólo se unen al ADN, interactúan entre sí. Podemos imaginar que la afinidad de unión de un factor de transcripción particular estará influenciada por la presencia de otro factor de transcripción ya unido a un sitio adyacente o solapado en el ADN. De manera similar, la estructura de una proteína puede cambiar cuando se une al ADN, y tal cambio puede conducir a interacciones con complejos de ADN:proteína ubicados en sitios más distantes, conocidos como potenciadores. Dichos elementos regulatorios, pueden formar parte de múltiples sistemas regulatorios diversos.
Por ejemplo, considere la siguiente situación. Dos genes comparten un potenciador común, dependiendo de la interacción que ocurra, el gen a o el gen b pero no ambos podrían estar activos. El resultado final es que las combinaciones de factores de transcripción están involucrados en activar y desactivar la expresión génica. En algunos casos, la misma proteína puede actuar positiva o negativamente, dependiendo del contexto, es decir, las secuencias reguladoras génicas específicas accesibles, los otros factores de transcripción expresados y sus diversas modificaciones postraduccionales. Aquí vale la pena señalar que la organización de secuencias reguladoras y codificantes en el ADN impone direccionalidad al sistema. Un factor de transcripción unido al ADN en una orientación o en una posición puede bloquear la unión de otras proteínas (o ARN polimerasa), mientras que unido a otro sitio podría estabilizar la unión de proteínas (ARN polimerasa). De manera similar, las proteínas de unión a ADN pueden interactuar con otras proteínas para controlar configuraciones de cromatina que pueden facilitar o bloquear la accesibilidad a secuencias reguladoras. Si bien es común ver una proteína factor de transcripción particular etiquetada como un activador transcripcional o represor, en realidad la actividad de una proteína a menudo refleja el gen específico y sus interacciones con diversos factores accesorios, todos los cuales pueden influir en la expresión génica.
El lugar exacto donde la ARN polimerasa comienza a transcribir ARN se conoce como el sitio de inicio de la transcripción. Donde se cae del ADN, y así deja de transcribir ARN, se conoce como el sitio de terminación de la transcripción. A medida que se inicia la transcripción, la ARN polimerasa se aleja del sitio de inicio de la transcripción. Una vez que el complejo de ARN polimerasa se aleja lo suficiente (despeja el sitio de inicio), hay espacio para que otro complejo de polimerasa se asocie con el ADN, a través de interacciones con factores de transcripción. Suponiendo que la región reguladora y sus factores asociados permanecen intactos, el tiempo para cargar una nueva polimerasa será relativamente más rápido que el tiempo que lleva construir un nuevo complejo regulatorio desde cero. Esta es una razón por la que a menudo se encuentra que la transcripción ocurre en ráfagas, se sintetizan varios ARN a partir de un gen particular en un corto período de tiempo, seguido de un período de silencio transcripcional. Como se mencionó anteriormente, se observa un comportamiento de estallido similar en la síntesis de proteínas.