5.4: Ejercicio 1- Búsqueda de registros genéticos en bases de datos del NCBI
- Page ID
- 53757
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)
\( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)
( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)
\( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)
\( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)
\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)
\( \newcommand{\Span}{\mathrm{span}}\)
\( \newcommand{\id}{\mathrm{id}}\)
\( \newcommand{\Span}{\mathrm{span}}\)
\( \newcommand{\kernel}{\mathrm{null}\,}\)
\( \newcommand{\range}{\mathrm{range}\,}\)
\( \newcommand{\RealPart}{\mathrm{Re}}\)
\( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)
\( \newcommand{\Argument}{\mathrm{Arg}}\)
\( \newcommand{\norm}[1]{\| #1 \|}\)
\( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)
\( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)
\( \newcommand{\vectorA}[1]{\vec{#1}} % arrow\)
\( \newcommand{\vectorAt}[1]{\vec{\text{#1}}} % arrow\)
\( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vectorC}[1]{\textbf{#1}} \)
\( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)
\( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)
\( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)
\( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)
\(\newcommand{\avec}{\mathbf a}\) \(\newcommand{\bvec}{\mathbf b}\) \(\newcommand{\cvec}{\mathbf c}\) \(\newcommand{\dvec}{\mathbf d}\) \(\newcommand{\dtil}{\widetilde{\mathbf d}}\) \(\newcommand{\evec}{\mathbf e}\) \(\newcommand{\fvec}{\mathbf f}\) \(\newcommand{\nvec}{\mathbf n}\) \(\newcommand{\pvec}{\mathbf p}\) \(\newcommand{\qvec}{\mathbf q}\) \(\newcommand{\svec}{\mathbf s}\) \(\newcommand{\tvec}{\mathbf t}\) \(\newcommand{\uvec}{\mathbf u}\) \(\newcommand{\vvec}{\mathbf v}\) \(\newcommand{\wvec}{\mathbf w}\) \(\newcommand{\xvec}{\mathbf x}\) \(\newcommand{\yvec}{\mathbf y}\) \(\newcommand{\zvec}{\mathbf z}\) \(\newcommand{\rvec}{\mathbf r}\) \(\newcommand{\mvec}{\mathbf m}\) \(\newcommand{\zerovec}{\mathbf 0}\) \(\newcommand{\onevec}{\mathbf 1}\) \(\newcommand{\real}{\mathbb R}\) \(\newcommand{\twovec}[2]{\left[\begin{array}{r}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\ctwovec}[2]{\left[\begin{array}{c}#1 \\ #2 \end{array}\right]}\) \(\newcommand{\threevec}[3]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\cthreevec}[3]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \end{array}\right]}\) \(\newcommand{\fourvec}[4]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\cfourvec}[4]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \end{array}\right]}\) \(\newcommand{\fivevec}[5]{\left[\begin{array}{r}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\cfivevec}[5]{\left[\begin{array}{c}#1 \\ #2 \\ #3 \\ #4 \\ #5 \\ \end{array}\right]}\) \(\newcommand{\mattwo}[4]{\left[\begin{array}{rr}#1 \amp #2 \\ #3 \amp #4 \\ \end{array}\right]}\) \(\newcommand{\laspan}[1]{\text{Span}\{#1\}}\) \(\newcommand{\bcal}{\cal B}\) \(\newcommand{\ccal}{\cal C}\) \(\newcommand{\scal}{\cal S}\) \(\newcommand{\wcal}{\cal W}\) \(\newcommand{\ecal}{\cal E}\) \(\newcommand{\coords}[2]{\left\{#1\right\}_{#2}}\) \(\newcommand{\gray}[1]{\color{gray}{#1}}\) \(\newcommand{\lgray}[1]{\color{lightgray}{#1}}\) \(\newcommand{\rank}{\operatorname{rank}}\) \(\newcommand{\row}{\text{Row}}\) \(\newcommand{\col}{\text{Col}}\) \(\renewcommand{\row}{\text{Row}}\) \(\newcommand{\nul}{\text{Nul}}\) \(\newcommand{\var}{\text{Var}}\) \(\newcommand{\corr}{\text{corr}}\) \(\newcommand{\len}[1]{\left|#1\right|}\) \(\newcommand{\bbar}{\overline{\bvec}}\) \(\newcommand{\bhat}{\widehat{\bvec}}\) \(\newcommand{\bperp}{\bvec^\perp}\) \(\newcommand{\xhat}{\widehat{\xvec}}\) \(\newcommand{\vhat}{\widehat{\vvec}}\) \(\newcommand{\uhat}{\widehat{\uvec}}\) \(\newcommand{\what}{\widehat{\wvec}}\) \(\newcommand{\Sighat}{\widehat{\Sigma}}\) \(\newcommand{\lt}{<}\) \(\newcommand{\gt}{>}\) \(\newcommand{\amp}{&}\) \(\definecolor{fillinmathshade}{gray}{0.9}\)El objetivo de este ejercicio es localizar los registros cromosómicos de referencia (NC__), transcripción (NM__) y proteína (NP___) para su gen. Necesitarás esta información para experiencias más adelante en el semestre.
Página principal: Señale su navegador a la página principal del NCBI: ncbi.nlm.nih.gov
NCBI mantiene una gran colección de bases de datos. Al hacer clic en el cuadro desplegable aparece la lista de bases de datos para realizar búsquedas más específicas. Para una búsqueda completa, utilice la configuración “Todas las bases de datos”. Escribe el nombre de tu gen MET en el cuadro de búsqueda y haz clic en “Buscar”.
Página de resumen:
Esta búsqueda te lleva a una página de resumen que enumera el número de visitas en muchas (pero no todas) bases de datos del NCBI. ¡El número es probablemente bastante grande! Echa un vistazo a los resultados. Tenga en cuenta que las bases de datos están ordenadas en categorías, incluyendo literatura, salud, genomas, genes, proteínas y químicos. Enumere a continuación el número de registros de su gen en las bases de datos PubMed, Nucleotide, Protein y Structure. (No puede recibir ningún aciertos en la categoría Estructura, ya que la gran mayoría de las proteínas no han sido cristalizadas ni estudiadas con RMN).
Base de datos de nucleótidos:
- Haga clic en la base de datos de nucleótidos (categoría genomas). Ten en cuenta los filtros que puedes usar para acotar tu búsqueda en las columnas izquierda y derecha. Las bases de datos de origen incluyen la base de datos primaria, GenBank, así como la base de datos derivada RefSeq, que contiene secuencias de referencia. Anote la diferencia en el número de registros en GenBank y Ref Seq. Al hacer clic en el enlace RefSeq se restringirán los resultados a secuencias de referencia
- El número de secuencias de referencia es probablemente todavía muy grande, debido a los muchos organismos para los que se dispone de información de secuencia. Un siguiente paso lógico es acotar su búsqueda taxonómicamente. Haga clic en el enlace Árbol en la columna derecha. Limite su búsqueda a los ascomicetos. (Tenga en cuenta que los términos de búsqueda se están agregando a la cadena de búsqueda en la parte superior de la página). A continuación, acota tu búsqueda dentro de los ascomicetos a los Saccharomyces. Debe ser capaz de encontrar las secuencias cromosómicas de referencia y transcritos de la cepa 288C.
- Veamos primero el registro NC___.
Registrar el número de acceso __________________________________
¿Qué cromosoma está representado en el registro? _________________
¿Cuántos nucleótidos hay en el cromosoma (pb)? __________________________ - Haga clic en el enlace GenBank asociado al registro NC_________________ (complete los números). Cerca de la parte superior, verás enlaces a artículos de la literatura primaria, que incluirán tanto el Goffeau et al. (1996) informe sobre el proyecto del genoma, así como un artículo más detallado sobre el cromosoma realizado por los investigadores que determinaron su secuencia.
- Desplázate un poco hacia abajo en este registro tan largo y al campo CARACTERÍSTICAS y mira algunos
genes. Notarás que la primera característica es un telómero, porque la secuencia comienza al final del brazo izquierdo del cromosoma. A medida que se desplaza hacia abajo, se está moviendo de un extremo del cromosoma al otro, y verá información de anotación para los ORF identificados por el SGP. Cada ORF tiene una descripción de su gen, ARNm y secuencia codificante (CDS). - Encuentre su gen MET en el registro NC escribiendo su nombre en el cuadro de búsqueda “Buscar” de su navegador.
Registrar la etiqueta locus de 7 caracteres (comienza con Y) ______________________
Este es el nombre sistemático asignado al ORF por el Proyecto Genoma de Saccharomyces. Esto sirve como identificador único del gen en la Base de Datos del Genoma de Saccharomyces.
¿Hay un intrón en tu gen? ___________________________
(Los intrones se manifestarán por interrupciones en los números de nucleótidos y la palabra “unirse” en el campo de ARNm para su gen).
- Encuentre el registro de transcripción haciendo clic en el enlace al registro NM__________________ (complete el número de acceso).
¿Cuántos nucleótidos hay en la secuencia génica anotada (pb)? _________________
Cursor hacia abajo a la secuencia de nucleótidos real al final del registro. Obsérvese que los ORF de S. cerevisiae anotados comienzan con un ATG y terminan con un codón de terminación.
¿El registro NM_ es la secuencia real del ARNm para su gen? ¿Por qué o por qué no? - Encuentra el campo para la secuencia codificante de proteínas (CDS) en el registro de transcripción de NM. El campo CDS contiene una traducción de la secuencia de nucleótidos NM. Encuentra el
NP_________________ (rellene los números) registro. Haga clic en el registro NP.
- El registro NP te dará información adicional sobre la proteína, incluyendo enlaces a información sobre su estructura, dominios conservados y homologos en otros organismos. Consulte el panel derecho en la página. Si hay una estructura tridimensional disponible para su proteína, verá un número de acceso PDB de 4 caracteres bajo “Estructura 3D de Proteína”. Registrar el número de acceso, si está disponible. (Si deseas ver la estructura, puedes buscar en el Banco de Datos de Proteínas en www.pdb.org ya sea con este número de acceso de tu nombre genético).