Saltar al contenido principal
LibreTexts Español

2.R: Estadística Descriptiva (Revisión)

  • Page ID
    150811
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    \( \newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\)

    ( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\id}{\mathrm{id}}\)

    \( \newcommand{\Span}{\mathrm{span}}\)

    \( \newcommand{\kernel}{\mathrm{null}\,}\)

    \( \newcommand{\range}{\mathrm{range}\,}\)

    \( \newcommand{\RealPart}{\mathrm{Re}}\)

    \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\)

    \( \newcommand{\Argument}{\mathrm{Arg}}\)

    \( \newcommand{\norm}[1]{\| #1 \|}\)

    \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\)

    \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    \( \newcommand{\vectorA}[1]{\vec{#1}}      % arrow\)

    \( \newcommand{\vectorAt}[1]{\vec{\text{#1}}}      % arrow\)

    \( \newcommand{\vectorB}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vectorC}[1]{\textbf{#1}} \)

    \( \newcommand{\vectorD}[1]{\overrightarrow{#1}} \)

    \( \newcommand{\vectorDt}[1]{\overrightarrow{\text{#1}}} \)

    \( \newcommand{\vectE}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash{\mathbf {#1}}}} \)

    \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \)

    \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)

    2.1 Datos de la pantalla

    Una gráfica de tallo y hoja es una forma de trazar datos y observar la distribución. En una gráfica de tallo y hoja, todos los valores de datos dentro de una clase son visibles. La ventaja en una gráfica de tallo y hoja es que se listan todos los valores, a diferencia de un histograma, que da clases de valores de datos. A menudo se usa un gráfico de líneas para representar un conjunto de valores de datos en los que una cantidad varía con el tiempo. Estas gráficas son útiles para encontrar tendencias. Es decir, encontrar un patrón general en conjuntos de datos que incluya temperatura, ventas, empleo, beneficio o costo de la compañía durante un periodo de tiempo. Un gráfico de barras es un gráfico que utiliza barras horizontales o verticales para mostrar comparaciones entre categorías. Un eje del gráfico muestra las categorías específicas que se comparan, y el otro eje representa un valor discreto. Algunos gráficos de barras presentan barras agrupadas en grupos de más de uno (gráficos de barras agrupados), y otros muestran las barras divididas en subpartes para mostrar el efecto acumulativo (gráficos de barras apiladas). Los gráficos de barras son especialmente útiles cuando se utilizan datos categóricos.

    Un histograma es una versión gráfica de una distribución de frecuencias. La gráfica consiste en barras de igual ancho dibujadas adyacentes entre sí. La escala horizontal representa clases de valores de datos cuantitativos y la escala vertical representa frecuencias. Las alturas de las barras corresponden a valores de frecuencia. Los histogramas se utilizan típicamente para conjuntos de datos cuantitativos, continuos y grandes. Un polígono de frecuencia también se puede utilizar al graficar grandes conjuntos de datos con puntos de datos que se repiten. Los datos suelen ir en el eje y con la frecuencia graficada en el eje x. Los gráficos de series temporales pueden ser útiles cuando se observan grandes cantidades de datos para una variable durante un período de tiempo.

    2.2 Medidas de la Ubicación de los Datos

    Los valores que dividen un conjunto de datos ordenados por rango en 100 partes iguales se denominan percentiles. Se utilizan percentiles para comparar e interpretar datos. Por ejemplo, una observación al percentil 50 sería mayor al 50 por ciento de las demás observaciones del conjunto. Los cuartiles dividen los datos en trimestres. El primer cuartil (\(Q_1\)) es el percentil 25, el segundo cuartil (\(Q_2\)o mediana) es el percentil 50 y el tercer cuartil (\(Q_3\)) es el percentil 75. El rango intercuartil, o\(IQR\), es el rango del medio 50 por ciento de los valores de los datos. El\(IQR\) se encuentra restando\(Q_1\) de\(Q_3\), y puede ayudar a determinar valores atípicos mediante el uso de las siguientes dos expresiones.

    • \(Q_3 + IQR(1.5)\)
    • \(Q_1 – IQR(1.5)\)

    2.3 Medidas del Centro de Datos

    La media y la mediana se pueden calcular para ayudarle a encontrar el “centro” de un conjunto de datos. La media es la mejor estimación para el conjunto de datos real, pero la mediana es la mejor medida cuando un conjunto de datos contiene varios valores atípicos o valores extremos. El modo le indicará el dato (o datos) que ocurre con mayor frecuencia en su conjunto de datos. La media, la mediana y el modo son extremadamente útiles cuando necesitas analizar tus datos, pero si tu conjunto de datos consiste en rangos que carecen de valores específicos, la media puede parecer imposible de calcular. Sin embargo, la media se puede aproximar si se agrega el límite inferior con el límite superior y se divide por dos para encontrar el punto medio de cada intervalo. Multiplique cada punto medio por el número de valores encontrados en el rango correspondiente. Divida la suma de estos valores por el número total de valores de datos en el conjunto.

    2.6 La asimetría y la media, la mediana y el modo

    Observar la distribución de los datos puede revelar mucho sobre la relación entre la media, la mediana y el modo. Hay tres tipos de distribuciones. Una distribución sesgada derecha (o positiva) tiene una forma similar a la de la Figura\(\PageIndex{11}\).

    2.7 Medidas de la propagación de los datos

    La desviación estándar puede ayudarle a calcular la propagación de los datos. Existen diferentes ecuaciones a utilizar si se está calculando la desviación estándar de una muestra o de una población.

    • La Desviación Estándar nos permite comparar datos individuales o clases con la media del conjunto de datos numéricamente.
    • \(s=\sqrt{\frac{\sum(x-\overline{x})^{2}}{n-1}} \text { or } s=\sqrt{\frac{\sum f(x-\overline{x})^{2}}{n-1}}\)es la fórmula para calcular la desviación estándar de una muestra. Para calcular la desviación estándar de una población, se utilizaría la media poblacional, μ y la fórmula\(\sigma=\sqrt{\frac{\sum(x-\mu)^{2}}{N}} \text { or } \sigma=\sqrt{\frac{\sum f(x-\mu)^{2}}{N}}\).

    This page titled 2.R: Estadística Descriptiva (Revisión) is shared under a CC BY 4.0 license and was authored, remixed, and/or curated by OpenStax via source content that was edited to the style and standards of the LibreTexts platform; a detailed edit history is available upon request.