domingo, 10 diciembre 2023

Estadística

Al azar

La estadística estudia conjuntos de datos para calcular su media, su desviación típica, etc., y, eventualmente, compararlos con otros conjuntos de datos.


En lo que sigue consideraremos los dos siguientes conjuntos de datos (referidos, por ejemplo, a puntuaciones obtenidas por dos personas que realizan una prueba Apuntes y problemas para exportar a blog__3525 y Apuntes y problemas para exportar a blog__3526 veces, respectivamente). Los conjuntos de datos se llaman también distribuciones:

Apuntes y problemas para exportar a blog__3527 Primera persona (Apuntes y problemas para exportar a blog__3528 datos): Apuntes y problemas para exportar a blog__3529

Apuntes y problemas para exportar a blog__3530 Segunda persona (Apuntes y problemas para exportar a blog__3531 datos): Apuntes y problemas para exportar a blog__3532


  • Se llama frecuencia absoluta al número de veces que se repite un dato. Por ejemplo, la frecuencia del Apuntes y problemas para exportar a blog__3533 en la primera distribución es Apuntes y problemas para exportar a blog__3534, y en la segunda: Apuntes y problemas para exportar a blog__3535. La frecuencia relativa de un dato se calcula dividiendo su frecuencia absoluta por el número total de datos de la distribución; así, la frecuencia relativa del dato “Apuntes y problemas para exportar a blog__3536” en la primera distribución es Apuntes y problemas para exportar a blog__3537, y en la segunda: Apuntes y problemas para exportar a blog__3538.

  • Moda es el valor que se repite más (tiene mayor frecuencia) en una distribución de datos. La moda de la primera distribución es Apuntes y problemas para exportar a blog__3539, y la de la segunda, Apuntes y problemas para exportar a blog__3540 Hay distribuciones que tienen más de una moda.

  • Mediana es el valor central de una distribución en la que hemos previamente ordenado sus datos de menor a mayor (o al revés). Si el número de datos es par, la mediana es la media de los dos centrales. Para la primera distribución (Apuntes y problemas para exportar a blog__3541) la mediana es Apuntes y problemas para exportar a blog__3542, y para la segunda, Apuntes y problemas para exportar a blog__3543.

  • Media aritmética es la suma de los datos dividido por el número de ellos. La media, Apuntes y problemas para exportar a blog__3544, para la primera distribución es: Apuntes y problemas para exportar a blog__3545

La fracción escrita se suele simplificar mediante la operación matemática llamada sumatorio (que se simboliza Apuntes y problemas para exportar a blog__3546) así:Apuntes y problemas para exportar a blog__3547 El numerador se lee “sumatorio desde Apuntes y problemas para exportar a blog__3548 hasta Apuntes y problemas para exportar a blog__3549 de los valores Apuntes y problemas para exportar a blog__3550“.

Apuntes y problemas para exportar a blog__3551 Dada la serie de números: Apuntes y problemas para exportar a blog__3552, calcular Apuntes y problemas para exportar a blog__3553 Apuntes y problemas para exportar a blog__3554Sol.: Apuntes y problemas para exportar a blog__3555

$\vspace{1pt}$

La media para la segunda distribución de datos que estamos considerando es: Apuntes y problemas para exportar a blog__3557

  • Se llama desviación de un dato a la diferencia (con signo positivo) entre ese dato y la media. Por ejemplo, en la primera distribución, la diferencia entre el dato Apuntes y problemas para exportar a blog__3558 y la media es: Apuntes y problemas para exportar a blog__3559; por tanto, la desviación de dicho dato es Apuntes y problemas para exportar a blog__3560 La media de las desviaciones de todos los datos se llama desviación media. Si llamamos Apuntes y problemas para exportar a blog__3561 al número de datos de una distribución, la fórmula para calcular su desviación media es:

    Apuntes y problemas para exportar a blog__3562

Para la primera distribución, la desviación media es:

Apuntes y problemas para exportar a blog__3563

y para la segunda distribución:

Apuntes y problemas para exportar a blog__3564
  • La varianza, que se representa con el símbolo Apuntes y problemas para exportar a blog__3565 (“sigma cuadrado”), es la media de los cuadrados de las desviaciones, es decir: Apuntes y problemas para exportar a blog__3566.

Una fórmula más sencilla para la varianza es: Apuntes y problemas para exportar a blog__3567 (es decir, media de los cuadrados menos cuadrado de la media).

Aplicando cualquiera de estas fórmulas a ambas distribuciones obtenemos los siguientes valores de la varianza:

Apuntes y problemas para exportar a blog__3568
  • La desviación típica, que se representa con el símbolo Apuntes y problemas para exportar a blog__3569 (”sigma”), es la raíz cuadrada de la varianza. Las desviaciones típicas para ambas distribuciones son, pues:

Apuntes y problemas para exportar a blog__3570

La desviación típica, la varianza y la desviación media dan una medida de la dispersión de los datos alrededor de la media.

Apuntes y problemas para exportar a blog__3571 Dadas Apuntes y problemas para exportar a blog__3572 puntuaciones, todas ellas Apuntes y problemas para exportar a blog__3573, la media es evidentemente Apuntes y problemas para exportar a blog__3574. La desviación media, la varianza y la desviación típica son Apuntes y problemas para exportar a blog__3575 (compruébese)

Apuntes y problemas para exportar a blog__3576 Sean las distribuciones Apuntes y problemas para exportar a blog__3577 y Apuntes y problemas para exportar a blog__3578, cuya media (en ambos casos) es Apuntes y problemas para exportar a blog__3579 La desviación típica de la primera es, aproximadamente, Apuntes y problemas para exportar a blog__3580, y la de la segunda, Apuntes y problemas para exportar a blog__3581. La gran diferencia se debe a que en la primera distribución los datos son todos muy próximos a la media, en tanto que en la segunda los datos están muy dispersos

En las distribuciones llamadas normales o gaussianas se cumple que aproximadamente el Apuntes y problemas para exportar a blog__3582 de los datos quedan dentro del intervalo Apuntes y problemas para exportar a blog__3583

Apuntes y problemas para exportar a blog__3584 La primera distribución de las que estamos considerando puede considerarse aproximadamente gaussiana. Comprobar que aproximadamente el Apuntes y problemas para exportar a blog__3585 de los datos está dentro del intervalo Apuntes y problemas para exportar a blog__3586. Sol.: Como la media esApuntes y problemas para exportar a blog__3587, y la desviación típica, Apuntes y problemas para exportar a blog__3588, el intervalo en cuaestión es: Apuntes y problemas para exportar a blog__3589. De los Apuntes y problemas para exportar a blog__3590 valores, Apuntes y problemas para exportar a blog__3591 están comprendidos en ese intervalo, lo que representa el Apuntes y problemas para exportar a blog__3592, que se está algo alejado del valor Apuntes y problemas para exportar a blog__3593, por lo que sólo puede considerarse aproximadamente gaussiana (si bien son pocos datos los que tenemos para juzgar)

Apuntes y problemas para exportar a blog__3594 Demostrar que la segunda distribución es aproximadamente gaussiana. El intervalo Apuntes y problemas para exportar a blog__3595 es: Apuntes y problemas para exportar a blog__3596. Siete datos están dentro de ese intervalo (el Apuntes y problemas para exportar a blog__3597), por lo que puede considerarse gaussiana (si bien son pocos datos para juzgarlo)

  • El coeficiente de variación (Apuntes y problemas para exportar a blog__3598) sirve para comparar la dispersión relativa de datos de dos muestras. Se calcula por la fórmula Apuntes y problemas para exportar a blog__3599. La muestra que tenga menor Apuntes y problemas para exportar a blog__3600 es la menos dispersa en términos relativos.

Apuntes y problemas para exportar a blog__3601 Calcular los Apuntes y problemas para exportar a blog__3602 de la dos distribuciones que estamos tratando e indicar en cuál de ellas los datos están menos dispersos (relativamente una a otra) (Sol.: Apuntes y problemas para exportar a blog__3603; Apuntes y problemas para exportar a blog__3604; La segunda distribución es más homogénea que la primera, es decir, los datos están, relativamente, menos dispersos en la segunda que en la primera.

  • Normalmente, en Estadística no se trabaja con los datos tal como nos los dan, sino que previamente se suelen tipificar, operación que permite compararlos directamente con los de otra distribución cualquiera. En lasdistribuciones normales, al tipificar los datos los valores de éstos quedan siempre dentro del intervalo Apuntes y problemas para exportar a blog__3605, aproximadamente. Un dato Apuntes y problemas para exportar a blog__3606 se tipifica (con lo que se llamará Apuntes y problemas para exportar a blog__3607) aplicando la fórmula Apuntes y problemas para exportar a blog__3608

Apuntes y problemas para exportar a blog__3609 Tipificar el dato ”Apuntes y problemas para exportar a blog__3610” de la primera distribución (Apuntes y problemas para exportar a blog__3611; Apuntes y problemas para exportar a blog__3612) Sol.: Apuntes y problemas para exportar a blog__3613

Apuntes y problemas para exportar a blog__3614 Tipificar el dato ”Apuntes y problemas para exportar a blog__3615” de la segunda distribución (Apuntes y problemas para exportar a blog__3616; Apuntes y problemas para exportar a blog__3617) (Sol.: Apuntes y problemas para exportar a blog__3618)

Relacionados

Dejar un comentario

Suscripción a Triplenlace

Últimos artículos