domingo, 7 de junio de 2020

Tema 10: ESTIMACIÓN Y/O SIGNIFICACIÓN ESTADÍSTICA

1. Significación estadística 


Cómo comenzar este tema debemos hablar del concepto de la significación estadística que es la probabilidad de que la
relación observada sea producto de la casualidad (por ejemplo, debido al azar), es decir, es la probabilidad que tenemos
de confundirnos, desde un punto de vista estadístico, cuando ofrecemos un resultado.


Así, cuando damos un resultado con una p < 0.05 indicamos que la probabilidad de que la relación observada se deba
al azar es de 0.05 por 1, o expresándolo en porcentajes, del 5%.


El valor de p < 0.05 es el mínimo universalmente exigido para poder concluir que las diferencias son estadísticamente
significativas en los estudios en ciencias de la salud, al inferir los resultados obtenidos en la muestra a la población diana.


El valor de p no es una medida de fuerza de asociación. Este valor informa sobre la existencia de una diferencia entre ambos
grupo y de la probabilidad de que no se deba al azar, pero no informa sobre la causa de las diferencias. Que un estudio
obtenga un valor de p<0,001 no quiere decir que la asociación encontrada sea más fuerte que la de otro con una p<0,04, solo
quiere decir que es más improbable que es resultado se haya debido al azar.


Recordemos que dentro de la estadística inferencial una de las dos formas de inferencia estadística es el contraste de
hipótesis  (la otra es la estimación puntual y/o por intervalos).


- Permite contrastar hipótesis y relacionarlo con el método  científico.
- Se parte de la hipótesis nula, frente a la hipótesis  alternativa.
- Permite calcular el nivel de significación.
- Nos permite tomar decisiones, cuantificando el error.



2. Contraste de hipótesis


La prueba o el contraste de hipótesis consiste en contrastar la hipótesis del estudio con los datos obtenidos en la muestra con
el fin de verificar si existen diferencias en los hallazgos obtenidos en ambos grupos debidas a la acción de la variable
independiente, o si simplemente estas diferencias han sido fruto del azar.

El contraste de hipótesis nos permite decidir si los resultados obtenidos son fruto de la causalidad (por una relación
causa-efecto) o de la casualidad (por azar).


Este método consiste, en definitiva, en un proceso de toma de decisiones, que consta de varias fases. 


Son herramientas estadísticas para  responder a preguntas de investigación y permite cuantificar la compatibilidad entre
una hipótesis previamente establecida y los  resultados obtenidos. Por tanto, Lo primero que tenemos que hacer es
formular nuestra hipótesis nula a partir de la hipótesis de investigación o alternativa. Esta hipótesis o afirmación (una
creencia o teoría), hace  referencia a una o varias características de la población: 


Ejemplo:


Tendremos dos grupos de sujetos con un valor medio de hemoglobina glicosilada para cada grupo y, a través de las pruebas
de contraste de hipótesis, podremos comparar si existen diferencias significativas entre las  dos medias y desvelar cuál de
los dos patrones de alimentación es más beneficioso para la evolución de la diabetes. 


La hipótesis nula (H0), también llamada la hipótesis de no diferencia, indica que no existen diferencias significativas
entre los resultados obtenidos en la práctica y los resultados teóricos, es decir, que no hay relación real entre las variables y
que cualquier relación observada es producto del azar, de la casualidad, o debida a fluctuaciones en el muestreo. Así, la
hipótesis nula indica que la media de la población A es igual a la de la población B. 

Ejemplo: Hipótesis Nula (Ho): no existencia de diferencias entre los dos patrones de alimentación,  o que cualquier
relación observada entre las dos opciones se debe netamente a la casualidad (azar) o a variaciones del muestreo.


La hipótesis de investigación o alternativa (H1 o Ha) la que afirma que la media de la población es un valor diferente al
hipotético. 


Ejemplo: Hipótesis alternativa (Ha): representa la existencia de diferencias entre los dos patrones de alimentación, y que
estas diferencias son demasiado importantes para que el azar pueda explicarlas o justificarlas


La necesidad de contar con una hipótesis nula radica en que la comprobación estadística de la hipótesis constituye
generalmente un proceso de rechazo de esta. Si bien resulta imposible demostrar de forma directa si la hipótesis alternativa
es o no correcta, sí es posible demostrar si la hipótesis nula es incorrecta. ¿Por qué? 


Porque mientras la hipótesis nula tiene solo una posibilidad, que la μA y la μB sean iguales, la hipótesis alternativa tiene
infinitas posibilidades. Es algo que al principio parece un poco enrevesado, pero que tiene una explicación lógica:
matemáticamente, resulta más fácil comprobar si dos medias son iguales que comprobar que son diferentes. 


Se utiliza la prueba estadística correspondiente y se mide la  probabilidad de error al rechazar la hipótesis nula, asociada al 
valor de p


Según el nivel de significación que hayamos preestablecido  (habitualmente un 95%) las soluciones pueden ser:


p>0,05: en este caso no podemos rechazar la hipótesis nula (no podemos  decir que sea cierta, sino que no podemos
rechazarla)


p<0,05: en este caso rechazamos la hipótesis nula, por lo que debemos  aceptar la alternativa.


Fase 1 


Lo primero que tenemos que hacer es formular nuestra hipótesis nula a partir de la hipótesis de investigación o alternativa. 


La hipótesis nula (H0), también llamada la hipótesis de no diferencia, indica que no existen diferencias significativas entre
los resultados obtenidos en la practica y los resultados teóricos, es decir, que no hay relación real entre las variables y que
cualquier relación observada es producto del azar, de la casualidad, o debida a fluctuaciones en el muestreo. Así, la
hipótesis nula indica que la media de la población A es igual a la de la población B. 


Normalmente se expresa de la siguiente forma, H0: μA = μB 


Es la hipótesis de investigación o alternativa (H1 o Ha) la que afirma que la media de la población es un valor diferente
al hipotético. 


Se suele expresar de la siguiente forma, H1: μA ≠ μB 

Por tanto, lo que el investigador pretende mediante la aplicación de pruebas estadísticas al realizar el contraste de hipótesis
es probar si la hipótesis nula es verdadera o falsa.

-Si la hipótesis nula es verdadera, solo hay una posibilidad: μA=μB, por tanto, no hay diferencias estadísticamente
significativas entre los grupos y no hay relación real entre las variables. Las posibles diferencias encontradas (sería muy
raro que los valores fueran exactamente iguales) son debidas al azar o a características de la muestra, pero no hay relación
causa-efecto entre las variables que se analizan. 


-Si la hipótesis nula es falsa, tenemos claro que μA ≠ μB, pero no sabemos si μA < μB o si μA > μB. Para saber cuál es el
sentido de la diferencia, es preciso hacer un contraste bilateral o de dos colas (que es el que normalmente hacen por defecto
los paquetes estadísticos). 


¿Qué es eso del contraste bilateral?


La clasificación de las hipótesis, según si estas indican o no el sentido de la diferencia, se denominan direccionales o no
direccionales. 


Las hipótesis no direccionales o bilaterales, solo indican que el parámetro de la población es diferente al hipotéticamente
establecido, sin especificar si es un valor mayor o menor, y requieren pruebas de hipótesis bilaterales. En estos casos, el
valor de α se distribuye en las dos colas de la curva, por lo que cada cola adopta un valor de α / 2. Esto significa que si el
valor de α es 0.05, el valor en cada cola de α es 0.025 (0.05 / 2). 


En el caso de que la hipótesis sea direccional o unilateral, además de afirmar que el parámetro es diferente, indicamos si
es mayor o menor. Requeriría un contraste de hipótesis unilateral, teniendo en cuenta solo una cola de la distribución, en
la que el valor de α será de 0.05. Sin embargo, como ya se ha indicado, la mayoría de las aplicaciones estadísticas realizan
un contraste bilateral, para descartar que el efecto que se produce no es el contrario, aunque la lógica y los conocimientos
que poseemos sobre el problema objeto de estudio indiquen cuál puede ser la dirección esperada; de hecho, cuando leemos
un artículo de investigación en el que se ha hecho un contraste de hipótesis, debemos suponer que este ha sido bilateral, a
no ser que los autores especifiquen lo contrario. 


Por ejemplo, hay diversos estudios que apuntan que la visita prequirúrgica de la enfermera reduce los niveles de ansiedad
del paciente que va a ser intervenido. Imaginemos que queremos saber si esto también es así en pacientes que son
reintervenidos de una misma cirugía. Deberíamos hacer un contraste de hipótesis bilateral, dejando abierta la posibilidad de
que los niveles de ansiedad aumenten, puesto que, aunque en la mayoría de los estudios han obtenido como resultado que
los niveles de ansiedad disminuyen, puede ser que en estos pacientes en concreto (quienes son reintervenidos) los niveles de
ansiedad aumenten. 



¿Cómo se formula la H0?

Cuando la H0 se formula a partir de una hipótesis (alternativa) unilateral, por ejemplo, la intervención A es más eficaz que
la B, que se expresa H1: μA > μB.
La hipótesis nula postula entonces que B es, como mínimo, tan eficaz como A. 


Se expresa, entonces: H0: μA ≤ μB (porque la H1: μA>μB) 


Cuando la H0 se formula a partir de una hipótesis bilateral, por ejemplo, la intervención A tiene una eficacia diferente que
la B, que se expresa H1: μA≠μB. La hipótesis nula postula entonces que B es igual de eficaz que A, lo que se expresa:
H0: μA = μB.

Fase 2


Tras formular la H0 se calcula, mediante el estadístico de contraste más apropiado, la probabilidad de que los resultados
observados puedan deberse al azar, es decir, la probabilidad de que, a partir de la población de referencia puedan
obtenerse otras dos muestras que presenten unos valores tan diferentes como los observados. Esta probabilidad es la
significación estadística (p)


Un estadístico de contraste de hipótesis o de significación estadística es una medida estandarizada de la discrepancia que
hay entre la hipótesis nula y el resultado de la diferencia de medias obtenido en la muestra. Calcula, por tanto, la
robabilidad de que los resultados obtenidos en una investigación reflejen un efecto significativo y no sean producto del azar,
es decir, calculan el grado de significación estadística o el valor de p. 


¿Cómo se elige el estadístico de contraste? 


La elección del test más adecuado para realizar el contraste de hipótesis depende de los objetivos del análisis y de la
comprobación de que los datos cumplan un conjunto de supuestos o características, que son: 


La escala de medida y el tipo de variables: las escalas de medida más precisas permiten aplicar técnicas estadísticas
más potentes (por eso se indicaba, al tratar las diferentes escalas de medidas de la variable, que se debe intentar medir las
variables de la forma más precisa posible). 


La independencia o dependencia de las medidas: debemos tener en cuenta si los datos proceden de participantes
independientes (la puntuación de un sujeto no proporciona información sobre la de otro ni condiciona la puntuación de este
otro sujeto), en cuyo caso se denominan medidas independientes; o si por el contrario las mediciones se hacen en los
mismos participantes en diferentes momentos de tiempo o condiciones diferentes (como en los estudios antes y después).
En este caso, se consideran medidas dependientes o relacionadas. 


 - El aspecto de la distribución de la variable dependiente: en ciencias de la salud, donde se suele trabajar con muestras
grandes (n > 30), y donde las variables que estudiamos generalmente se distribuyen según la curva normal o de Gauss, los
datos suelen cumplir los supuestos que permiten la aplicación de contrastes paramétricos. 


Estos supuestos son: 


a) Normalidad y distribución homogénea de las varianzas u homocedasticidad. 
b) Trabajar con una escala de medida de razón o de intervalo. 


En el caso de que estos supuestos no se cumplan, se utilizan los contrastes no paramétricos, que permiten poner a prueba
hipótesis no referidas a parámetros poblacionales (en estos casos la distribución de frecuencias de la variable dependiente
puede asemejarse a la distribución de Poisson o a la de t de Student). 



Aunque, como ya se ha explicado, el estadístico de contraste a elegir dependerá de lo expuesto, en las investigaciones
epidemiológicas que realizamos habitualmente los enfermeros, los contrastes que utilizamos suelen ser los paramétricos que
aparecen en la Tabla.


Por ejemplo, asumiendo que la distribución es normal, y que se cumplen las condiciones de aplicación de los estadísticos de
contraste de hipótesis para pruebas paramétricas: 


– Si quisiéramos probar si la asistencia a unas clases de preparación al parto reducen la ansiedad-rasgo de los padres,
deberíamos utilizar la t de Student, pues se contrasta una variable cualitativa de dos categorías: asistencia al parto (sí/no)
y una cuantitativa (la puntuación de ansiedad rasgo). 


–  Si quisiéramos probar si el tiempo de duración del parto influye en la puntuación de Apgar del recién nacido al minuto,
deberíamos utilizar el coeficiente de correlación de Pearson, puesto que las variables que se contrastan son las dos
cuantitativas (el tiempo de duración del parto y la puntuación del test de Apgar). 


–  Para probar si el nivel de estudios de la madre influye en el tiempo que dura la lactancia materna, deberíamos utilizar el
ANOVA. En este caso, se trata de una variable cualitativa de más de dos categorías (sin estudios/primarios/secundarios/
universitarios) y de una cuantitativa (el tiempo de duración de la lactancia materna). 


–  Para probar si asistir a clases de Pilates reduce el dolor lumbar, siendo las variables: asistencia a clases de Pilates (sí/no)
y dolor lumbar (no dolor/leve/moderado/intenso), deberíamos utilizar la chi cuadrado, pues son dos variables cualitativas


Fase 3


Basándose en esta probabilidad, se decidirá rechazar o no la hipótesis nula. Así, cuanto menor sea el valor de p,
menor será la probabilidad de que los resultados obtenidos se deban al azar y mayor evidencia habrá en contra de la
hipótesis nula. 


Para decidir si se rechaza o no la H0 debe fijarse previamente un valor de p por debajo del cual se considera que se dispone
de la suficiente evidencia contra la H0 para rechazarla. Este valor se denomina valor de significación estadística α, que de
forma arbitraria, y por convenio, se fija habitualmente en el 5% (0.05)


Con los datos obtenidos en el estudio calculamos, con el estadístico de contraste adecuado, el valor de p. 


Si el valor de p obtenido es superior al limite critico, es decir, al valor que facilitan las tablas o la aplicación estadística
para ese nivel de confianza, estaríamos en la región crítica y rechazamos la hipótesis nula. Podremos decir, asumiendo
ese nivel de confianza, que existen diferencias estadísticamente significativas. 


Si por el contrario el valor de p obtenido es inferior al del limite critico, estaríamos en la región de aceptación. En ese
caso, aceptamos la hipótesis nula e indicamos que no hay diferencias estadísticamente significativas. 


Cuando la diferencia no es estadísticamente significativa, quiere decir que no se ha encontrado la suficiente evidencia
para decir que las medias son diferentes, y los estudios se denominan estudios negativos. 


El valor de p no es una medida de fuerza de asociación. Este valor informa sobre la existencia de una diferencia entre ambos
grupos y de la probabilidad de que no se deba al azar, pero no informa sobre la causa de las diferencias. Así, un estudio que
obtenga un valor de p<0.001 no quiere decir que la asociación encontrada sea más fuerte que la de otro con una p<0.04,
solo quiere decir que es más improbable que el resultado haya sido debido al azar. 


Aunque las hipótesis nulas se aceptan o rechazan con base en los datos de una muestra, las hipótesis se formulan acerca de
los valores de la población. Así pues, el interés real de la prueba de hipótesis, como el de toda la inferencia estadística,
consiste en formular conclusiones acerca de las relaciones existentes en la población a partir de una muestra. 


3. Errores de hipótesis


¿Me habré equivocado aceptando o rechazando la hipótesis nula? 


Efectivamente nos podemos equivocar, ya que como no trabajamos con la población total sino con una muestra
representativa de la misma, resulta imposible asegurar de forma absoluta (con una certeza del 100%) que la hipótesis nula
es verdadera o falsa. El investigador debe darse por satisfecho con saber que probablemente lo sea, sin olvidar que toda
inferencia estadística lleva implícito siempre el riesgo de cometer algún error. Todo depende de ese error, al que llamamos α,
Por tanto, El error α es la probabilidad de equivocarnos al  rechazar la hipótesis nula.


A partir de los resultados de un estudio, puede llegarse a diferentes conclusiones:

- Puede concluirse que existen diferencias entre los grupos que componen la muestra y que esas diferencias también
existirían en otras muestras diferentes tomadas en esa población.


- Puede concluirse que no hay diferencias entre los grupos que componen la muestra y que esas diferencias tampoco
existirían en otras muestras diferentes tomadas en esa población. 


En cualquiera de estos dos casos, no habríamos cometido ningún error, puesto que lo que ha ocurrido en la muestra hubiera
ocurrido igual en cualquier otra muestra de la población.

Pero la toma de alguna de estas dos decisiones no está exenta de riesgo de equivocación, o sea, el investigador puede
equivocarse y rechazar Ho cuando realmente es cierta, o bien, aceptar Ho cuando verdaderamente es falsa. 


El error tipo I que consiste en decir que existen diferencias estadísticamente significativas (porque realmente sí existen
en la muestra que se ha tomado) cuando realmente esto no es cierto (estas diferencias no existirían en otras de las infinitas
muestras que podrían haberse tomado de esa población). 


Al cometer este error, el investigador rechaza la hipótesis nula (dice que hay diferencias) aunque realmente no las hay. 


La probabilidad de cometer este error suele ser 0.05. Esta probabilidad es lo que mide precisamente la significación
estadística p, que, universalmente se acordó que fuera como mínimo de α = 0.05 (aunque en ocasiones se trabaja con un
α = 0.01, cuando se dan resultados con una p < 0.01). Por tanto, la probabilidad de cometer este error se denomina α y por
eso al error tipo I también se le conoce como error α. 


El error tipo II en el que se indica que no existen diferencias (en la muestra no se hallan diferencias estadísticamente
significativas), cuando realmente esto no es cierto (sí las habría en otras de las infinitas muestras que se podrían haber
tomado de la población). 


A este tipo de error también se le conoce como error β. 


Al cometer este error, el investigador acepta la hipótesis nula (dice que no hay diferencias) cuando realmente sí las hay.
Como ya se comentó, la probabilidad de cometer este error ha de establecerse ya para calcular el tamaño de la muestra, y
generalmente oscila entre el 5 y el 20%, en función de las consecuencias que pueda tener cometerlo. 


La probabilidad de cometer este error suele ser 0.2, ya que su complementario (1-β) es el poder estadístico o potencia
estadística, que como ya se ha comentado, suele establecerse en 0.8, lo que indicaría, como ya se ha explicado, que el
estudio tendría un 80% de probabilidad de detectar diferencias si estas realmente existen. 


Dicho de otro modo: el error tipo I dice que hay diferencias cuando realmente no existen. 


El error tipo II afirma que no hay diferencias cuando realmente sí existen. 




El error tipo II es más probable que se cometa que el tipo I (0.2 > 0.05) . ¿Por qué? 


Porque, como ya se ha comentado, es preferible equivocarse y decir que una intervención no es efectiva cuando realmente
sí lo es (cometer el error tipo II) que decir que es efectiva cuando realmente no lo es (error tipo I). 


El error tipo II o β habitualmente se sitúa entre el 0.05 y el 0.2. La elección del valor variará en función de las
consecuencias que pueda tener cometer dicho error, pues no es lo mismo cometerlo para una intervención educativa que en
un fármaco, por ejemplo. 


Así, si fijamos un error β del 20% (0.2), la potencia del estudio será de 0.80 = (1 – 0.2), y eso significa que, si la diferencia
realmente existe, el estudio tiene un 80% de probabilidad de detectarla. 












No hay comentarios:

Publicar un comentario