5.9: Tamaños del genoma
- Page ID
- 57086
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)
\( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)
( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)
\( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)
\( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)
\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)
\( \newcommand{\Span}{\mathrm{span}}\)
\( \newcommand{\id}{\mathrm{id}}\)
\( \newcommand{\Span}{\mathrm{span}}\)
\( \newcommand{\kernel}{\mathrm{null}\,}\)
\( \newcommand{\range}{\mathrm{range}\,}\)
\( \newcommand{\RealPart}{\mathrm{Re}}\)
\( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)
\( \newcommand{\Argument}{\mathrm{Arg}}\)
\( \newcommand{\norm}[1]{\| #1 \|}\)
\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)
\( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)
\( \newcommand{\vectorA}[1]{\vec{#1}} % arrow\)
\( \newcommand{\vectorAt}[1]{\vec{\text{#1}}} % arrow\)
\( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vectorC}[1]{\textbf{#1}} \)
\( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)
\( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)
\( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)
\(\newcommand{\avec}{\mathbf a}\) \(\newcommand{\bvec}{\mathbf b}\) \(\newcommand{\cvec}{\mathbf c}\) \(\newcommand{\dvec}{\mathbf d}\) \(\newcommand{\dtil}{\widetilde{\mathbf d}}\) \(\newcommand{\evec}{\mathbf e}\) \(\newcommand{\fvec}{\mathbf f}\) \(\newcommand{\nvec}{\mathbf n}\) \(\newcommand{\pvec}{\mathbf p}\) \(\newcommand{\qvec}{\mathbf q}\) \(\newcommand{\svec}{\mathbf s}\) \(\newcommand{\tvec}{\mathbf t}\) \(\newcommand{\uvec}{\mathbf u}\) \(\newcommand{\vvec}{\mathbf v}\) \(\newcommand{\wvec}{\mathbf w}\) \(\newcommand{\xvec}{\mathbf x}\) \(\newcommand{\yvec}{\mathbf y}\) \(\newcommand{\zvec}{\mathbf z}\) \(\newcommand{\rvec}{\mathbf r}\) \(\newcommand{\mvec}{\mathbf m}\) \(\newcommand{\zerovec}{\mathbf 0}\) \(\newcommand{\onevec}{\mathbf 1}\) \(\newcommand{\real}{\mathbb R}\) \(\newcommand{\twovec}[2]{\left[\begin{array}{r}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\ctwovec}[2]{\left[\begin{array}{c}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\threevec}[3]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\cthreevec}[3]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\fourvec}[4]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\cfourvec}[4]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\fivevec}[5]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\cfivevec}[5]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\mattwo}[4]{\left[\begin{array}{rr}#1 \amp #2 \\ #3 \amp #4 \\ \end{array}\right]}\) \(\newcommand{\laspan}[1]{\text{Span}\{#1\}}\) \(\newcommand{\bcal}{\cal B}\) \(\newcommand{\ccal}{\cal C}\) \(\newcommand{\scal}{\cal S}\) \(\newcommand{\wcal}{\cal W}\) \(\newcommand{\ecal}{\cal E}\) \(\newcommand{\coords}[2]{\left\{#1\right\}_{#2}}\) \(\newcommand{\gray}[1]{\color{gray}{#1}}\) \(\newcommand{\lgray}[1]{\color{lightgray}{#1}}\) \(\newcommand{\rank}{\operatorname{rank}}\) \(\newcommand{\row}{\text{Row}}\) \(\newcommand{\col}{\text{Col}}\) \(\renewcommand{\row}{\text{Row}}\) \(\newcommand{\nul}{\text{Nul}}\) \(\newcommand{\var}{\text{Var}}\) \(\newcommand{\corr}{\text{corr}}\) \(\newcommand{\len}[1]{\left|#1\right|}\) \(\newcommand{\bbar}{\overline{\bvec}}\) \(\newcommand{\bhat}{\widehat{\bvec}}\) \(\newcommand{\bperp}{\bvec^\perp}\) \(\newcommand{\xhat}{\widehat{\xvec}}\) \(\newcommand{\vhat}{\widehat{\vvec}}\) \(\newcommand{\uhat}{\widehat{\uvec}}\) \(\newcommand{\what}{\widehat{\wvec}}\) \(\newcommand{\Sighat}{\widehat{\Sigma}}\) \(\newcommand{\lt}{<}\) \(\newcommand{\gt}{>}\) \(\newcommand{\amp}{&}\) \(\definecolor{fillinmathshade}{gray}{0.9}\)El genoma de un organismo es el conjunto completo de genes que especifican cómo se desarrollará su fenotipo (bajo cierto conjunto de condiciones ambientales). En este sentido, entonces, los organismos diploides (como nosotros mismos) contienen dos genomas, uno heredado de nuestra madre, el otro de nuestro padre. La siguiente tabla presenta una selección de tamaños genómicos representativos de la lista de organismos de rápido crecimiento cuyos genomas han sido secuenciados.
Pares de bases | Genes | Notas | |
---|---|---|---|
ΦX174 | 5,386 | 11 | virus de E. coli |
Mitocondrias humanas | 16,569 | 37 | |
Nasuia deltocefalinicola | 112,091 | 137 | genoma más pequeño encontrado en una bacteria. Esta β-proteobacteria vive en una relación mutualista dentro de un órgano especial de un insecto (una tolva foliar) que aporta aminoácidos esenciales. |
Virus de Epstein-Barr (VEB) | 172,282 | 80 | causa mononucleosis |
nucleomorfo de Guillardia theta | 551,264 | 511 | todo lo que queda del genoma nuclear de un alga roja (un eucariota) envuelto hace mucho tiempo por otro eucariota |
Mycoplasma genitalium | 580,073 | 525 | dos de los organismos verdaderos más pequeños |
Mycoplasma pneumoniae | 816,394 | 679 | |
Rickettsia prowazekii | 1,111,523 | 834 | bacteria que causa tifus epidémico |
Treponema pallidum | 1,138,011 | 1,039 | bacteria que causa la sífilis |
Pelagibacter | 1,308,759 | 1,354 | genoma más pequeño hasta ahora encontrado en un organismo de vida libre (α-proteobacterium marino) |
Helicobacter pylori | 1,667,867 | 1,589 | causa principal de úlceras estomacales (no estrés y dieta) |
Methanocaldococcus jannaschii | 1,664,970 | 1,783 | Estos microbios unicelulares parecen bacterias típicas pero sus genes son tan diferentes a los de bacterias o eucariotas que se clasifican en un tercer reino: Archaea. |
Aeropyrum pernix | 1,669,695 | 1,885 | |
Metanothermobacter thermoautotrophicus | 1,751,377 | 2,008 | |
Streptococcus pneumoniae | 2,160,837 | 2,236 | el neumococo |
Pandoravirus | 2,473,870 | 2556 | Un virus (de una ameba) con un genoma mayor que el de las bacterias y arqueas arriba y aproximadamente el mismo que el de algunos eucariotas parásitos. |
Listeria monocytogenes | 2,944,528 | 2,926 | 2,853 de estos codifican proteínas; el resto ARN |
Synechocystis | 3,573,470 | 4,003 | una cianobacteria marina (“alga azul-verde”) |
E. coli K-12 | 4,639,221 | 4,377 | 4.290 de estos genes codifican proteínas; el resto ARN |
E. coli O157:H7 | 5.44 x 10 6 | 5,416 | cepa que es patógena para humanos; tiene 1.346 genes que no se encuentran en E. coli K-12 |
Schizosaccharomyces pombe | 12,462,637 | 4,929 | Levadura de fisión. Un eucariota con menos genes que las tres bacterias de abajo. |
Agrobacterium tumefaciens | 4,674,062 | 5,419 | Vector útil para hacer plantas transgénicas; comparte muchos genes con Sinorhizobium meliloti |
Pseudomonas aeruginosa | 6.3 x 10 6 | 5,570 | Causa cada vez más común de infecciones oportunistas en humanos. |
Sinorhizobium meliloti | 6,691,694 | 6,204 | El simbionte rizobial de la alfalfa. El genoma consta de un cromosoma y 2 plásmidos grandes. |
Saccharomyces cerevisiae | 12,495,682 | 5,770 | Levadura en ciernes. Un eucariota. |
Neurospora crassa | 38,639,769 | 10,082 | Más 498 genes de ARN. |
Thalassiosira pseudonana | 34.5 x 10 6 | 11,242 | Una diatomea. Más 144 cloroplastos y 40 genes mitocondriales que codifican proteínas |
Naegleria gruberi | 41 x 10 6 | 15,727 | Este organismo unicelular de vida libre vive como una forma ameboide y flagelada. 4,133 de sus genes también se encuentran en otros eucariotas sugiriendo que estaban presentes en el ancestro común de todos los eucariotas. La gran variedad de funciones codificadas por estos genes también sugiere que el ancestro común de todos los eucariotas era en sí mismo tan complejo como muchos de los miembros unicelulares actuales. |
Drosophila melanogaster | 122,653,977 | ~17,000 | la “mosca de la fruta” |
Caenorhabditis elegans | 100,258,171 | 21,733 | |
Humanos | 3.3 x 10 9 | ~21.000 | |
Tetraodon nigroviridis (un pez globo) | 3.42 x 10 8 | 27,918 | Aunque Tetraodon parece tener más genes codificantes de proteínas que nosotros, tiene mucho menos ADN no codificante por lo que su genoma total es aproximadamente una décima parte del tamaño del nuestro. |
Ratón | 2.8 x 10 9 | ~23,000 | |
Anfibios | 10 9 —10 11 | ? | |
Arabidopsis thaliana | 0.135 x 10 9 | 27,407 | una planta con flores (angiosperma) con uno de los genomas más pequeños conocidos en el reino vegetal. |
Picea abies | 19.6 x 10 9 | 28,354 | el abeto noruego, una conífera (gimnosperma). A pesar de que solo tiene ~900 genes más que Arabidopsis, tiene 145 veces más ADN. La mayor parte de esto parece ser derivado de transposones. |
Psilotum nudum | 2.5 x 10 11 | ? |
Aunque Psilotum nudum (a veces llamado el “helecho batidor”) es una planta mucho más simple que Arabidopsis (no tiene hojas, flores o frutos verdaderos), tiene 3000 veces más ADN. Nadie sabe por qué, pero el 80% o más de él es ADN repetitivo que no contiene información genética. Este es también el caso de algunos anfibios, que contienen 30 veces más ADN que nosotros, pero ciertamente no son 30 veces más complejos. La cantidad total de ADN en el genoma haploide se llama su valor C. La falta de una relación consistente entre el valor C y la complejidad de un organismo (por ejemplo, anfibios vs. mamíferos) se denomina paradoja del valor C.
No todos los genes son Indispensables
Los científicos del Instituto de Investigaciones Genómicas (ahora conocido como el Instituto J. Craig Venter) que determinaron la secuencia de Mycoplasma genitalium han seguido este trabajo destruyendo sistemáticamente sus genes (mutándolos con inserciones) para ver cuáles son esenciales para la vida y que son prescindibles. De los 485 genes que codifican proteínas, han concluido que sólo 381 de ellos son esenciales para la vida. Es decir, la pérdida de cualquiera de los 381 es letal; la pérdida de cualquiera de los demás no lo es. (Esto no quiere decir que todas las necesidades del organismo sean esas 381 — ver “¿Un Genoma Mínimo?” abajo.)
Utilizando técnicas similares, tres grupos han encontrado recientemente que solo alrededor del 10% de los genes en el genoma humano (~2000 de ellos) deben estar presentes para que las células humanas crezcan exitosamente en cultivo. Estos genes codifican proteínas para funciones esenciales como el control del ciclo celular, la replicación del ADN, la transcripción del ADN y la traducción del ARN. Las células pueden tolerar la pérdida de cualquiera de los otros ~18,000 genes. Así, el genoma humano parece tener vías redundantes que a menudo pueden compensar la pérdida de un solo gen al menos para las células que crecen en cultivo. Probablemente otros resultarán esenciales para el desarrollo y funcionamiento de los diversos tipos de células diferenciadas en el cuerpo intacto.
¿
En marzo de 2016, trabajadores del Instituto J. Craig Venter informaron que habían creado una cepa de micoplasma que contenía sólo 473 genes. Este organismo sintético, que crece vigorosamente en cultivo, ahora tiene el récord del genoma más pequeño de un organismo de vida libre.