LA ESTADÍSTICA Y SUS COSAS : Tema 10: ESTIMACIÓN Y/O SIGNIFICACIÓN ESTADÍSTICA

1. Significación estadística

Cómo comenzar este tema debemos hablar del concepto de la significación estadística que es la probabilidad de que la
relación observada sea producto de la casualidad (por ejemplo, debido al azar), es decir, es la probabilidad que tenemos
de confundirnos, desde un punto de vista estadístico, cuando ofrecemos un resultado.

Así, cuando damos un resultado con una p < 0.05 indicamos que la probabilidad de que la relación observada se deba
al azar es de 0.05 por 1, o expresándolo en porcentajes, del 5%.

El valor de p < 0.05 es el mínimo universalmente exigido para poder concluir que las diferencias son estadísticamente
significativas en los estudios en ciencias de la salud, al inferir los resultados obtenidos en la muestra a la población diana.

El valor de p no es una medida de fuerza de asociación. Este valor informa sobre la existencia de una diferencia entre ambos
grupo y de la probabilidad de que no se deba al azar, pero no informa sobre la causa de las diferencias. Que un estudio
obtenga un valor de p<0,001 no quiere decir que la asociación encontrada sea más fuerte que la de otro con una p<0,04, solo
quiere decir que es más improbable que es resultado se haya debido al azar.

Recordemos que dentro de la estadística inferencial una de las dos formas de inferencia estadística es el contraste de
hipótesis (la otra es la estimación puntual y/o por intervalos).

- Permite contrastar hipótesis y relacionarlo con el método científico.

- Se parte de la hipótesis nula, frente a la hipótesis alternativa.

- Permite calcular el nivel de significación.

- Nos permite tomar decisiones, cuantificando el error.

2. Contraste de hipótesis

La prueba o el contraste de hipótesis consiste en contrastar la hipótesis del estudio con los datos obtenidos en la muestra con
el fin de verificar si existen diferencias en los hallazgos obtenidos en ambos grupos debidas a la acción de la variable
independiente, o si simplemente estas diferencias han sido fruto del azar.

El contraste de hipótesis nos permite decidir si los resultados obtenidos son fruto de la causalidad (por una relación
causa-efecto) o de la casualidad (por azar).

Este método consiste, en definitiva, en un proceso de toma de decisiones, que consta de varias fases.

Son herramientas estadísticas para responder a preguntas de investigación y permite cuantificar la compatibilidad entre
una hipótesis previamente establecida y los resultados obtenidos. Por tanto, Lo primero que tenemos que hacer es
formular nuestra hipótesis nula a partir de la hipótesis de investigación o alternativa. Esta hipótesis o afirmación (una
creencia o teoría), hace referencia a una o varias características de la población:

Ejemplo:

Tendremos dos grupos de sujetos con un valor medio de hemoglobina glicosilada para cada grupo y, a través de las pruebas
de contraste de hipótesis, podremos comparar si existen diferencias significativas entre las dos medias y desvelar cuál de
los dos patrones de alimentación es más beneficioso para la evolución de la diabetes.

La hipótesis nula (H0), también llamada la hipótesis de no diferencia, indica que no existen diferencias significativas
entre los resultados obtenidos en la práctica y los resultados teóricos, es decir, que no hay relación real entre las variables y
que cualquier relación observada es producto del azar, de la casualidad, o debida a fluctuaciones en el muestreo. Así, la
hipótesis nula indica que la media de la población A es igual a la de la población B.

Ejemplo: Hipótesis Nula (Ho): no existencia de diferencias entre los dos patrones de alimentación, o que cualquier
relación observada entre las dos opciones se debe netamente a la casualidad (azar) o a variaciones del muestreo.

La hipótesis de investigación o alternativa (H1 o Ha) la que afirma que la media de la población es un valor diferente al
hipotético.

Ejemplo: Hipótesis alternativa (Ha): representa la existencia de diferencias entre los dos patrones de alimentación, y que
estas diferencias son demasiado importantes para que el azar pueda explicarlas o justificarlas

La necesidad de contar con una hipótesis nula radica en que la comprobación estadística de la hipótesis constituye
generalmente un proceso de rechazo de esta. Si bien resulta imposible demostrar de forma directa si la hipótesis alternativa
es o no correcta, sí es posible demostrar si la hipótesis nula es incorrecta. ¿Por qué?

Porque mientras la hipótesis nula tiene solo una posibilidad, que la μA y la μB sean iguales, la hipótesis alternativa tiene
infinitas posibilidades. Es algo que al principio parece un poco enrevesado, pero que tiene una explicación lógica:
matemáticamente, resulta más fácil comprobar si dos medias son iguales que comprobar que son diferentes.

Se utiliza la prueba estadística correspondiente y se mide la probabilidad de error al rechazar la hipótesis nula, asociada al
valor de p

Según el nivel de significación que hayamos preestablecido (habitualmente un 95%) las soluciones pueden ser:

p>0,05: en este caso no podemos rechazar la hipótesis nula (no podemos decir que sea cierta, sino que no podemos
rechazarla)

p<0,05: en este caso rechazamos la hipótesis nula, por lo que debemos aceptar la alternativa.

Fase 1

Lo primero que tenemos que hacer es formular nuestra hipótesis nula a partir de la hipótesis de investigación o alternativa.

La hipótesis nula (H0), también llamada la hipótesis de no diferencia, indica que no existen diferencias significativas entre
los resultados obtenidos en la practica y los resultados teóricos, es decir, que no hay relación real entre las variables y que
cualquier relación observada es producto del azar, de la casualidad, o debida a fluctuaciones en el muestreo. Así, la
hipótesis nula indica que la media de la población A es igual a la de la población B.

Normalmente se expresa de la siguiente forma, H0: μA = μB

Es la hipótesis de investigación o alternativa (H1 o Ha) la que afirma que la media de la población es un valor diferente
al hipotético.

Se suele expresar de la siguiente forma, H1: μA ≠ μB

Por tanto, lo que el investigador pretende mediante la aplicación de pruebas estadísticas al realizar el contraste de hipótesis
es probar si la hipótesis nula es verdadera o falsa.

-Si la hipótesis nula es verdadera, solo hay una posibilidad: μA=μB, por tanto, no hay diferencias estadísticamente
significativas entre los grupos y no hay relación real entre las variables. Las posibles diferencias encontradas (sería muy
raro que los valores fueran exactamente iguales) son debidas al azar o a características de la muestra, pero no hay relación
causa-efecto entre las variables que se analizan.

-Si la hipótesis nula es falsa, tenemos claro que μA ≠ μB, pero no sabemos si μA < μB o si μA > μB. Para saber cuál es el
sentido de la diferencia, es preciso hacer un contraste bilateral o de dos colas (que es el que normalmente hacen por defecto
los paquetes estadísticos).

¿Qué es eso del contraste bilateral?

La clasificación de las hipótesis, según si estas indican o no el sentido de la diferencia, se denominan direccionales o no
direccionales.

Las hipótesis no direccionales o bilaterales, solo indican que el parámetro de la población es diferente al hipotéticamente
establecido, sin especificar si es un valor mayor o menor, y requieren pruebas de hipótesis bilaterales. En estos casos, el
valor de α se distribuye en las dos colas de la curva, por lo que cada cola adopta un valor de α / 2. Esto significa que si el
valor de α es 0.05, el valor en cada cola de α es 0.025 (0.05 / 2).

En el caso de que la hipótesis sea direccional o unilateral, además de afirmar que el parámetro es diferente, indicamos si
es mayor o menor. Requeriría un contraste de hipótesis unilateral, teniendo en cuenta solo una cola de la distribución, en
la que el valor de α será de 0.05. Sin embargo, como ya se ha indicado, la mayoría de las aplicaciones estadísticas realizan
un contraste bilateral, para descartar que el efecto que se produce no es el contrario, aunque la lógica y los conocimientos
que poseemos sobre el problema objeto de estudio indiquen cuál puede ser la dirección esperada; de hecho, cuando leemos
un artículo de investigación en el que se ha hecho un contraste de hipótesis, debemos suponer que este ha sido bilateral, a
no ser que los autores especifiquen lo contrario.

Por ejemplo, hay diversos estudios que apuntan que la visita prequirúrgica de la enfermera reduce los niveles de ansiedad
del paciente que va a ser intervenido. Imaginemos que queremos saber si esto también es así en pacientes que son
reintervenidos de una misma cirugía. Deberíamos hacer un contraste de hipótesis bilateral, dejando abierta la posibilidad de
que los niveles de ansiedad aumenten, puesto que, aunque en la mayoría de los estudios han obtenido como resultado que
los niveles de ansiedad disminuyen, puede ser que en estos pacientes en concreto (quienes son reintervenidos) los niveles de
ansiedad aumenten.

¿Cómo se formula la H0?

Cuando la H0 se formula a partir de una hipótesis (alternativa) unilateral, por ejemplo, la intervención A es más eficaz que
la B, que se expresa H1: μA > μB.

La hipótesis nula postula entonces que B es, como mínimo, tan eficaz como A.

Se expresa, entonces: H0: μA ≤ μB (porque la H1: μA>μB)

Cuando la H0 se formula a partir de una hipótesis bilateral, por ejemplo, la intervención A tiene una eficacia diferente que
la B, que se expresa H1: μA≠μB. La hipótesis nula postula entonces que B es igual de eficaz que A, lo que se expresa:
H0: μA = μB.

Fase 2

Tras formular la H0 se calcula, mediante el estadístico de contraste más apropiado, la probabilidad de que los resultados
observados puedan deberse al azar, es decir, la probabilidad de que, a partir de la población de referencia puedan
obtenerse otras dos muestras que presenten unos valores tan diferentes como los observados. Esta probabilidad es la
significación estadística (p).

Un estadístico de contraste de hipótesis o de significación estadística es una medida estandarizada de la discrepancia que
hay entre la hipótesis nula y el resultado de la diferencia de medias obtenido en la muestra. Calcula, por tanto, la
robabilidad de que los resultados obtenidos en una investigación reflejen un efecto significativo y no sean producto del azar,
es decir, calculan el grado de significación estadística o el valor de p.

¿Cómo se elige el estadístico de contraste?

La elección del test más adecuado para realizar el contraste de hipótesis depende de los objetivos del análisis y de la
comprobación de que los datos cumplan un conjunto de supuestos o características, que son:

– La escala de medida y el tipo de variables: las escalas de medida más precisas permiten aplicar técnicas estadísticas
más potentes (por eso se indicaba, al tratar las diferentes escalas de medidas de la variable, que se debe intentar medir las
variables de la forma más precisa posible).

– La independencia o dependencia de las medidas: debemos tener en cuenta si los datos proceden de participantes
independientes (la puntuación de un sujeto no proporciona información sobre la de otro ni condiciona la puntuación de este
otro sujeto), en cuyo caso se denominan medidas independientes; o si por el contrario las mediciones se hacen en los
mismos participantes en diferentes momentos de tiempo o condiciones diferentes (como en los estudios antes y después).
En este caso, se consideran medidas dependientes o relacionadas.

- El aspecto de la distribución de la variable dependiente: en ciencias de la salud, donde se suele trabajar con muestras
grandes (n > 30), y donde las variables que estudiamos generalmente se distribuyen según la curva normal o de Gauss, los
datos suelen cumplir los supuestos que permiten la aplicación de contrastes paramétricos.

Estos supuestos son:

a) Normalidad y distribución homogénea de las varianzas u homocedasticidad.

b) Trabajar con una escala de medida de razón o de intervalo.

En el caso de que estos supuestos no se cumplan, se utilizan los contrastes no paramétricos, que permiten poner a prueba
hipótesis no referidas a parámetros poblacionales (en estos casos la distribución de frecuencias de la variable dependiente
puede asemejarse a la distribución de Poisson o a la de t de Student).

Aunque, como ya se ha explicado, el estadístico de contraste a elegir dependerá de lo expuesto, en las investigaciones
epidemiológicas que realizamos habitualmente los enfermeros, los contrastes que utilizamos suelen ser los paramétricos que
aparecen en la Tabla.

Por ejemplo, asumiendo que la distribución es normal, y que se cumplen las condiciones de aplicación de los estadísticos de
contraste de hipótesis para pruebas paramétricas:

– Si quisiéramos probar si la asistencia a unas clases de preparación al parto reducen la ansiedad-rasgo de los padres,
deberíamos utilizar la t de Student, pues se contrasta una variable cualitativa de dos categorías: asistencia al parto (sí/no)
y una cuantitativa (la puntuación de ansiedad rasgo).

– Si quisiéramos probar si el tiempo de duración del parto influye en la puntuación de Apgar del recién nacido al minuto,
deberíamos utilizar el coeficiente de correlación de Pearson, puesto que las variables que se contrastan son las dos
cuantitativas (el tiempo de duración del parto y la puntuación del test de Apgar).

– Para probar si el nivel de estudios de la madre influye en el tiempo que dura la lactancia materna, deberíamos utilizar el
ANOVA. En este caso, se trata de una variable cualitativa de más de dos categorías (sin estudios/primarios/secundarios/
universitarios) y de una cuantitativa (el tiempo de duración de la lactancia materna).

– Para probar si asistir a clases de Pilates reduce el dolor lumbar, siendo las variables: asistencia a clases de Pilates (sí/no)
y dolor lumbar (no dolor/leve/moderado/intenso), deberíamos utilizar la chi cuadrado, pues son dos variables cualitativas.

Fase 3

Basándose en esta probabilidad, se decidirá rechazar o no la hipótesis nula. Así, cuanto menor sea el valor de p,
menor será la probabilidad de que los resultados obtenidos se deban al azar y mayor evidencia habrá en contra de la
hipótesis nula.

Para decidir si se rechaza o no la H0 debe fijarse previamente un valor de p por debajo del cual se considera que se dispone
de la suficiente evidencia contra la H0 para rechazarla. Este valor se denomina valor de significación estadística α, que de
forma arbitraria, y por convenio, se fija habitualmente en el 5% (0.05).

Con los datos obtenidos en el estudio calculamos, con el estadístico de contraste adecuado, el valor de p.

Si el valor de p obtenido es superior al limite critico, es decir, al valor que facilitan las tablas o la aplicación estadística
para ese nivel de confianza, estaríamos en la región crítica y rechazamos la hipótesis nula. Podremos decir, asumiendo
ese nivel de confianza, que existen diferencias estadísticamente significativas.

Si por el contrario el valor de p obtenido es inferior al del limite critico, estaríamos en la región de aceptación. En ese
caso, aceptamos la hipótesis nula e indicamos que no hay diferencias estadísticamente significativas.

Cuando la diferencia no es estadísticamente significativa, quiere decir que no se ha encontrado la suficiente evidencia
para decir que las medias son diferentes, y los estudios se denominan estudios negativos.

El valor de p no es una medida de fuerza de asociación. Este valor informa sobre la existencia de una diferencia entre ambos
grupos y de la probabilidad de que no se deba al azar, pero no informa sobre la causa de las diferencias. Así, un estudio que
obtenga un valor de p<0.001 no quiere decir que la asociación encontrada sea más fuerte que la de otro con una p<0.04,
solo quiere decir que es más improbable que el resultado haya sido debido al azar.

Aunque las hipótesis nulas se aceptan o rechazan con base en los datos de una muestra, las hipótesis se formulan acerca de
los valores de la población. Así pues, el interés real de la prueba de hipótesis, como el de toda la inferencia estadística,
consiste en formular conclusiones acerca de las relaciones existentes en la población a partir de una muestra.

3. Errores de hipótesis

¿Me habré equivocado aceptando o rechazando la hipótesis nula?

Efectivamente nos podemos equivocar, ya que como no trabajamos con la población total sino con una muestra
representativa de la misma, resulta imposible asegurar de forma absoluta (con una certeza del 100%) que la hipótesis nula
es verdadera o falsa. El investigador debe darse por satisfecho con saber que probablemente lo sea, sin olvidar que toda
inferencia estadística lleva implícito siempre el riesgo de cometer algún error. Todo depende de ese error, al que llamamos α,
Por tanto, El error α es la probabilidad de equivocarnos al rechazar la hipótesis nula.

A partir de los resultados de un estudio, puede llegarse a diferentes conclusiones:

- Puede concluirse que existen diferencias entre los grupos que componen la muestra y que esas diferencias también
existirían en otras muestras diferentes tomadas en esa población.

- Puede concluirse que no hay diferencias entre los grupos que componen la muestra y que esas diferencias tampoco
existirían en otras muestras diferentes tomadas en esa población.

En cualquiera de estos dos casos, no habríamos cometido ningún error, puesto que lo que ha ocurrido en la muestra hubiera
ocurrido igual en cualquier otra muestra de la población.

Pero la toma de alguna de estas dos decisiones no está exenta de riesgo de equivocación, o sea, el investigador puede
equivocarse y rechazar Ho cuando realmente es cierta, o bien, aceptar Ho cuando verdaderamente es falsa.

El error tipo I que consiste en decir que existen diferencias estadísticamente significativas (porque realmente sí existen
en la muestra que se ha tomado) cuando realmente esto no es cierto (estas diferencias no existirían en otras de las infinitas
muestras que podrían haberse tomado de esa población).

Al cometer este error, el investigador rechaza la hipótesis nula (dice que hay diferencias) aunque realmente no las hay.

La probabilidad de cometer este error suele ser 0.05. Esta probabilidad es lo que mide precisamente la significación
estadística p, que, universalmente se acordó que fuera como mínimo de α = 0.05 (aunque en ocasiones se trabaja con un
α = 0.01, cuando se dan resultados con una p < 0.01). Por tanto, la probabilidad de cometer este error se denomina α y por
eso al error tipo I también se le conoce como error α.

El error tipo II en el que se indica que no existen diferencias (en la muestra no se hallan diferencias estadísticamente
significativas), cuando realmente esto no es cierto (sí las habría en otras de las infinitas muestras que se podrían haber
tomado de la población).

A este tipo de error también se le conoce como error β.

Al cometer este error, el investigador acepta la hipótesis nula (dice que no hay diferencias) cuando realmente sí las hay.
Como ya se comentó, la probabilidad de cometer este error ha de establecerse ya para calcular el tamaño de la muestra, y
generalmente oscila entre el 5 y el 20%, en función de las consecuencias que pueda tener cometerlo.

La probabilidad de cometer este error suele ser 0.2, ya que su complementario (1-β) es el poder estadístico o potencia
estadística, que como ya se ha comentado, suele establecerse en 0.8, lo que indicaría, como ya se ha explicado, que el
estudio tendría un 80% de probabilidad de detectar diferencias si estas realmente existen.

Dicho de otro modo: el error tipo I dice que hay diferencias cuando realmente no existen.

El error tipo II afirma que no hay diferencias cuando realmente sí existen.

El error tipo II es más probable que se cometa que el tipo I (0.2 > 0.05) . ¿Por qué?

Porque, como ya se ha comentado, es preferible equivocarse y decir que una intervención no es efectiva cuando realmente
sí lo es (cometer el error tipo II) que decir que es efectiva cuando realmente no lo es (error tipo I).

El error tipo II o β habitualmente se sitúa entre el 0.05 y el 0.2. La elección del valor variará en función de las
consecuencias que pueda tener cometer dicho error, pues no es lo mismo cometerlo para una intervención educativa que en
un fármaco, por ejemplo.

Así, si fijamos un error β del 20% (0.2), la potencia del estudio será de 0.80 = (1 – 0.2), y eso significa que, si la diferencia
realmente existe, el estudio tiene un 80% de probabilidad de detectarla.

LA ESTADÍSTICA Y SUS COSAS

Home

domingo, 7 de junio de 2020

Tema 10: ESTIMACIÓN Y/O SIGNIFICACIÓN ESTADÍSTICA

No hay comentarios:

Publicar un comentario