Tema 9: Introducción a la inferencia estadística. Intervalos de confianza y contraste de hipótesis.

Estadística inferencial.

El objetivo de la estadística inferencial es "inferir", establecer unas conclusiones sobre una población a partir de los resultados obtenidos de una muestra, todo ello, con un determinado nivel de seguridad o intervalo de confianza. Por tanto el conjunto de procedimientos estadísticos que permiten pasar de lo particular (la muestra) a lo general (la población) se le denomina inferencia estadística.
La inferencia estadística exige la aleatoriedad en la selección de  los sujetos que forman la muestra:
  • Población: conjunto de personas, sujetos o unidades  que presentan unas características común. Puede ser finita o infinita.
  • Muestra: subconjunto extraído y selecionado de una población a la que representa.
  • Muestra independiente: está formada por datos independientes, aquellos obtenidos tras una  única observación.
  • Muestra apareada o dependiente: formada por datos apareados. Comparan el mismo grupo de sujetos en dos tiempos diferentes (ej: antes y después de una intervención), o bien son 2 grupos muy relacionados entre sí.
Hay 2 formas de inferencia estadística:
  • Estimación del valor de la población (parámetro) a partir de un valor de la muestra (estimador).
    • Estadístico/estimador: es el índice que representa una información de la muestra estudiada. Suelen expresarse mediante letras del alfabeto latino. Tiene unas propiedades deseables: insesgadez, eficiente, coonsistencia.
    • Parámetro: cada uno de los  estadísticos que tras inferirse, nos proporciona información sobre la población. Se representan con letras del alfabeto griego.
  • Contraste de hipótesis: a partir de valores de la muestra, se concluye si hay diferencias entre ellos en la población.

Las dos formas de estadística inferencial


Pruebas no paramétricas y pruebas paramétricas

Estimaciones

Las estimaciones son el proceso donde se usa la información de una muestra para extraer conclusiones acerca de toda la población. Se utiliza la información recogida para estimar un valor .
Se pueden realizar estimaciones puntales o por intervalos mediante el cálculo de intervalos de confianza.

Error estándar

El error estándar es una medida que trata de captar la variabilidad de los valores del estimador.
El error estándar de cualquier estimador mide el grado de variabilidad en los valores del estimador en las distintas muestras de un determinado tamaño que pudiésemos tomar de una población. Cuanto más pequeño es el error estándar, más nos podemos fiar del valor de una muestra concreta.
El error estándar se calcula:

  • Error estándar para una media: 

  • Error estándar para una proporción: se aplica cuando las variables del estudio son cualitativas o atributos.

Teorema central del límite

Para estimadores que pueden ser expresados como suma de  valores muestrales, la distribución de sus valores siguen una distribución normal con la media de la población y desviación típica igual al error estándar del estimador del que se trate.
Si sigue una distribución normal, sigue los principios básicos de ésta:

Intervalos de confianza

Se trata de un par de números tales que, con un nivel de confianza determinado, podamos asegurar que el valor del parámetro es mayor o menor que ambos números.
Se calcula considerando que el valor muestral sigue una distribución normal, como la establecida en la teoría central del límite.
  • Para nivel de confianza 95%, z=1,96
  • Para nivel de confianza 99%, z=2,58
  • Z es un valor que depende del nivel de confianza 1-a con que se quiera dar el intervalo.

Contrastes de hipótesis

Para controlar los errores aleatorios, además del cálculo de intervalos de confianza tenemos los test o contrastes de hipótesis, y la estrategia es la siguiente:
  • Establecemos a priori una hipótesis.
  • Realizamos la recogida de datos.
  • Analizamos la coherencia de entre la hipótesis previa y los datos obtenidos.








Comentarios