lunes, 25 de mayo de 2020

BLOQUE TEMÁTICO 3: ANÁLISIS DE DATOS II: INFERENCIA Y ESTIMACIÓN DE DATOS CUANTITATIVOS Y CUALITATIVOS. TEMA 9: INTRODUCCIÓN A LA INFERENCIA ESTADÍSTICA. INTERVALOS DE CONFIANZA Y CONTRASTES DE HIPÓTESIS

ÍNDICE
  1. Inferencia estadística
  2. Estimación puntual
  3. Error estándar
  4. Teorema central del límite
  5. Intervalos de confianza
  6. Contraste de hipótesis
1. Estadística inferencial

Es el conjunto de procedimientos estadísticos que permiten pasar de lo particular, la muestra, a lo general, la población.
- Población: Conjunto de personas, sujetos o unidades que presentan una característica común. Puede ser finita o infinita.
- Muestra: Subconjunto extraído y seleccionado de una población a la que representa.
  • Muestra Independiente: Está formada por datos independientes, o sea, aquellos obtenidos tras una única observación.
  • Muestra apareada o dependiente: Está constituida por datos apareados (también llamados dependientes o emparejados). Comparan el mismo grupo de sujetos en dos tiempos diferentes (por ejemplo antes y después de una intervención), o bien son grupos muy relacionados entre sí.
Hay 2 formas de inferencia estadística:

- ESTIMACIÓN: Parámetro - - Estimador

  • Estadístico o Estimador: Índice que representa una información de la muestra estudiada. Suelen expresarse mediante letras del alfabeto latino. Propiedades deseables: Insesgadez, Eficiente, Consistencia.
  • Parámetro: Cada uno de los estadísticos que tras inferirse, nos proporcionan información sobre la población. A diferencia de los estadísticos, éstos se representan mediante letras del alfabeto griego.



- CONTRASTE DE HIPÓTESIS





2. Estimaciones
Proceso de utilizar información de una muestra para extraer conclusiones acerca de toda la población. Se utiliza la información recogida para estimar un valor. Puede realizarse:  
  • Estimación puntual: Consiste en considerar al valor del estadístico muestral como una estimación del parámetro poblacional. Significa manejo de incertidumbre e imprecisión.

  • Estimación por intervalos: Consiste en calcular dos valores entre los cuales se encuentra el parámetro poblacional que queremos estimar con una probabilidad determinada, habitualmente el 95%. Se pueden crear para cualquier parámetro de la población. Se utilizan como indicadores de la variabilidad de las estimaciones. Cuanto más “estrecho” sea, mejor.

  • Cálculo de intervalos de confianza (explicado más abajo)
3. Error estándar
Es la medida que trata de captar la variabilidad de los valores del estimador. El error estándar de cualquier estimador mide el grado de variabilidad en los valores del estimador en las distintas muestras de un determinado tamaño que pudiésemos tomar de una población. Cuanto más pequeño es el error estándar de un estimador, más nos podemos fiar del valor de una muestra concreta.

* Cálculo del error estándar
Depende de cada estimador. 
- Error estándar para una media:
- Error estándar para una proporción: se aplica cuando las variables del estudio son cualitativas o atributos, en consecuencia no podemos cuantificarlos para obtener su media aritmética.
 P es el porcentaje o proporción a estimar.

4. Teorema central del límite 
Para estimadores que pueden ser expresados como suma de valores muestrales, la distribución de sus valores sigue una distribución normal con media de la de la población y desviación típica igual al error estándar del estimador de que se trate. Si sigue una distribución normal, sigue los principios básicos de ésta: 
– ± 1S: 68,26% de las observaciones
– ± 2S: 95,45% de las observaciones
– ± 1,95S: 95% de las observaciones
– ± 3S: 99,73% de las observaciones 
– ± 2,58S: 99% de las observaciones


5. Intervalos de confianza
Son un medio de conocer el parámetro en una población midiendo el error que tiene que ver con el azar (error aleatorio). Se trata de un par de números tales que, con un nivel de confianza determinados, podamos asegurar que el valor del parámetro es mayor o menor que ambos números. Se calcula considerando que el estimador muestral sigue una distribución normal, como establece la teoría central del límite Para construir un intervalo de confianza del 95% o del 99% se aplica la fórmula: 
Para nivel de confianza 95%    z=1,96
Para nivel de confianza 99%    z=2,58
(Z es un valor que depende del nivel de confianza 1-a con que se quiera dar el intervalo)

6. Contrastes de hipótesis
Para controlar los errores aleatorios, además del cálculo de intervalos de confianza, contamos con una segunda herramienta en el proceso de inferencia estadística: los tests o contrastes de hipótesis. Con los intervalos nos hacemos una idea de un parámetro de una población dando un par de números entre los que confiamos que esté el valor desconocido. Con los contrastes (tests) de hipótesis la estrategia es la siguiente: 
- Establecemos a priori una hipótesis acerca del valor del parámetro.
- Realizamos la recogida de datos.
- Analizamos la coherencia de entre la hipótesis previa y los datos obtenidos.

No hay comentarios:

Publicar un comentario