viernes, 15 de mayo de 2020

BLOQUE TEMÁTICO 2. TEMA 4: INTRODUCCIÓN A LA ESTADÍSTICA DESCRIPTIVA

ÍNDICE

  1. Estadística descriptiva
  2. Estadística inferencial
  3. Variables (presentación de datos)
  4. Variables continuas (tablas de frecuencias datos agrupados)
  5. Indicadores/ concepto de indicador
  6. Medidas de asociación: relaciones entre proporción, ratios y odds

1. Estadística descriptiva
Sirve para describir y resumir datos. Es el tipo de estadística que normalmente se usa en los medios de difusión. Describe y analiza una determinada población o muestra sin pretender sacar conclusiones de tipo general. También describe, analiza y representa un grupo de datos utilizando métodos numéricos y gráficos que resumen y presentan la información contenida en ellos. Además organiza de manera clara y fácil de analizar, resume los datos y explora las relaciones entre variables. Este tipo de estadística es preliminar antes que la inferencia. 

2. Estadística inferencial
Utiliza muestras de datos para sacar conclusiones sobre poblaciones más grandes. Este tipo de método se encuentra más frecuentemente en artículos publicados sobre investigación científica. Infiere o “induce” leyes de comportamiento de una población, a partir del estudio del análisis de una muestra. Apoyándose en el cálculo de probabilidad y a partir de datos muestrales, efectúa: estimaciones, decisiones, predicciones y generalizaciones sobre un conjunto mayor de datos.

3. Variables (presentación de datos)
Las tablas de frecuencia se realizan con datos que muestran frecuencias en columnas y las categorías de las variables en las filas. Presentan información repetitiva de forma visible y comprensible. Sus requisitos son:
  • Son autoexplicables
  • Son sencillas y de fácil comprensión
  • Tienen un título breve y claro
  • Indican lugar, fecha y fuente de información
  • Incluye las unidades de medida en cada cabecera
  • Indican frecuencias absolutas y relativas
* Tabla de frecuencia variable cualitativa dicotómica (ejemplo)



* Tabla de frecuencia variable cualitativa policotómica (ejemplo)











* Tabla de frecuencia variable cualitativa ordinal (ejemplo)








* Tabla de frecuencia variable cuantitativa discreta (ejemplo)











4. Variables continuas (tablas de frecuencias datos agrupados)
  • Definición de intervalos 
  • Definición de extremos de los intervalos
  • Definición de amplitud o distancia entre los extremos 
  • Cálculo de la marca de clase de cada intervalo
  • Frecuencias absolutas (𝒇𝒊 ): número de individuos que presentan una modalidad, o que están incluidos en un intervalo.
  • Frecuencias relativas (𝒉𝒊 ): proporción de individuos referidos al total que presentan una modalidad o que están incluidos en un intervalo.
  • Frecuencias acumuladas ( 𝒇𝒊 ó 𝒉𝒊 ): número de individuos menores o iguales que la modalidad o el intervalo que estamos estudiando.

Ejemplo

5. Indicadores/ concepto de indicador
En el análisis descriptivo se usan en gran medida los números relativos, que son la expresión de la relación de dos o más cantidades. La frecuencia absoluta no puede ser un indicador pues le falta un denominador que la relacione con el tamaño de la muestra o población, y/o el periodo en el que se presentaron los eventos. Los indicadores siempre están formados por un numerador y un denominador, es decir, es el resultado del cociente entre dos magnitudes. Un indicador es la medida de la frecuencia de un determinado suceso en una población, expresado como un número que puede ser: 

- Proporción: medida resumen para variables cualitativas, que consiste en la comparación, a través de un cociente (división) entre un subconjunto y el conjunto al que pertenece. El numerador siempre está incluido en el denominador. Adopta valores reales entre 0 y 1, expresando la frecuencia relativa del suceso que medimos. Se suele multiplicar por 100, para una mejor comprensión, expresando los porcentajes correspondientes. Si el suceso que medimos es muy poco frecuente, podemos multiplicar por 1.000, por 10.000, etc.

- Tasa: medida que expresa el riesgo de ocurrencia del evento (enfermedad) estudiado. En realidad es una proporción, pero con relación espacial y temporal. El denominador incluye una unidad de tiempo. Consiste en la comparación, a través de una división, entre el número de veces que ocurre un cierto tipo de evento y la población en la que puede ocurrir dicho evento en un tiempo determinado. Usualmente el resultado de tal división consiste en una cifra fraccionaria menor a 1, por lo que el resultado suele ser multiplicado por alguna constante que sea múltiplo de 10.

* Medidas más empleadas en estadística sanitaria
Según lo que queremos medir: 
- La situación en un punto en el tiempo: PREVALENCIA: Describe qué proporción de la población tiene la enfermedad en un punto específico en el tiempo: Depende de la velocidad de aparición de la enfermedad (incidencia) y de su duración. Características: es adimensional y adopta valores entre 0 y 1 (es una proporción).

- Lo que está pasando durante un periodo de tiempo: INCIDENCIA. Describe la frecuencia de NUEVOS CASOS que ocurren durante un periodo de tiempo. Es el flujo de sanos a enfermos, mide un cambio. Es una medida de riesgo. Características: es adimensional, adopta valores entre 0 y 1 (es una proporción), y si se mide como "Densidad de Incidencia", es una tasa, y adoptaría valores hipotéticos entre 0 e infinito. 
Hay dos tipos de incidencias: 
  • Incidencia acumulada (proporción de incidencia) Riesgo de que se produzca el suceso. Se calcula utilizando un período de tiempo durante el cual consideramos que todos los individuos de la población están a riesgo de la enfermedad. Es la proporción de sujetos que desarrollan la enfermedad, en un período de tiempo, del total de población a riesgo al inicio del período.  Mide el riesgo promedio de padecer la enfermedad (probabilidad de desarrollar la enfermedad).
- Mide la probabilidad de tener el evento. 
- No tiene unidades. Es una proporción (se expresa como %, %0 ... 
- Valores entre 0 y 1 [0 – 100]. 
- No lleva implícito el período de tiempo  debe expresarse siempre. 
- Condiciones: 
  • No puede haber pérdidas en el seguimiento. 
  • Se siguen a todos los sujetos durante todo el período. 
  • No permite inferir fuera del período de estudio.

  • Tasa de incidencia (densidad de incidencia): Velocidad de aparición de nuevos casos con respecto al tamaño de la población. Con frecuencia, no todos los individuos a riesgo (denominador) son seguidos durante el mismo período de tiempo. Si se disponen de los diferentes tiempos de observación (“tiempos en riesgo”) de los diferentes individuos, se puede calcular la densidad de incidencia o tasa de incidencia. Es necesario especificar la unidad de tiempo a las que se refiere la tasa (se mide en unidades de tiempo–1).Una misma cantidad de personas-tiempo se puede obtener mediante el seguimiento de distintos grupos de población.  Expresa la “tasa” o velocidad a la cual ocurren los eventos en sujetos de la población en riesgo en cualquier momento. (Tasa: datos agregados. Densidad de incidencia: tasa obtenida de datos individuales). 

Personas – tiempo:
- Suma de tiempos que los individuos están a riesgo de desarrollar el evento. 
- Las unidades a utilizar dependen del investigador. Los eventos poco frecuentes suelen describirse en personas-año o un múltiplo del mismo (100 o 1000 personas-año). En cambio en los eventos más frecuentes se pueden utilizar personas-semana o personas-día. 

* Relación entre prevalencia e incidencia

- Razón: es una medida de resumen para variables cualitativas que consiste en la comparación, a través de una división entre dos conjuntos. Los dos conjuntos son distintos, es decir, uno no incluye al otro. El numerador del cociente, por tanto, no está incluido en el denominador, como sí sucedía en las proporciones.

-Odds:  es el cociente entre la proporción o probabilidad de ocurrencia de un evento y la proporción o probabilidad (complementaria) de no ocurrencia, se denomina con el término inglés “odds”, empleado en el lenguaje de apuestas. No hay un término exacto en español, ni consenso en su traducción. El más aceptado es “ventaja” u “oportunidad”. La odds representa la frecuencia de un aspecto relativa a los sujetos que no presentan dicho aspecto, por lo que es un tipo especial de razón. Sus valores van desde 0 (eventos que nunca ocurren) hasta el infinito (eventos que ocurren siempre). Forma de cálculo: 


6. Medidas de asociación: relaciones entre proporción, ratios y odds
La magnitud de asociación entre dos fenómenos (por ejemplo entre un factor de exposición y una enfermedad), puede estimarse a través de medidas que relacionen proporciones, tasas y odds. Es lo que se llaman “MEDIDAS DE ASOCIACIÓN” y dependiendo del tipo de estudio, se usarán una u otra. Las tres más importantes son: 
  • Razón de prevalencias: Estudios descriptivos de corte transversal. Realiza una ratio entre dos prevalencias (proporciones). Es la razón entre la proporción de enfermos en los expuestos y la proporción de enfermos entre los no expuestos. Cuantifica una estimación de la asociación entre el factor de exposición y la enfermedad. Si el valor se aproxima a 1, la enfermedad se distribuye por igual entre los expuestos y los no expuestos. La relación entre la incidencia (nuevos casos) en expuestos I.e y la incidencia (nuevos casos) en no expuestos I.ne, se puede expresar como: 

  • Riesgo relativo o razón de riesgos: Estudios de observacionales de seguimiento o estudios experimentales. Realiza una ratio entre dos incidencias acumuladas (proporciones) o dos densidades de incidencia (tasas). Es la razón entre el riesgo en los expuestos y el riesgo en los no expuestos. Cuantifica el incremento en el riesgo producido por la exposición. Si el valor se aproxima a 1, la enfermedad o el suceso aparece de forma similar entre los expuestos y los no expuestos.

  • Odds ratio: Estudios de casos y controles. Realiza una ratio entre dos medidas “odds” o ventajas. Se trata de relacionar la ODDS o VENTAJA de los casos con la ODDS o VENTAJA de los controles. Toma valores > 1 =1 De 0 a 1.







No hay comentarios:

Publicar un comentario