martes, 29 de enero de 2008

INVESTIGACION IV

INVESTIGACION IV: BIOESTADISTICAS
INVESTIGACION IV BIOESTADISTICA

CONTENIDOS

ESTADISTICA, BIOESTADISTICA Y METODO CIENTIFICO
ETAPAS DEL METODO ESTADISTICO
PASOS DEL METODO CIENTIFICO
EJEMPLOS DE APLICACIÓN DEL METODO CIENTIFICO
CLASIFICACIÓN DE INFORMACIÓN
VARIABLES
NATUIRALEZA DE UNA VARIABLE
REPRESENTACION GRAFICA DE INFORMACION
MEDIDAS DE TENDENCIA CENTRAL
MEDIDAS DE DISPERSION
ESTADISTICA INFERENCIAL

INTRODUCCION


La variabilidad biológica de los individuos objeto de estudio de las ciencias de la salud origina que sus datos sean impredecibles y que el modo de controlarlos sea a través de los mètodos estadìsticos.

Por otra parte la investigación del método estadistico en sus etapas de diseño, recopilación de datos análisis de resultados y en la validación de las inducciones producto de la experimentación

El volumen del información que recibe el profesional de la salud le exige conocimientos estadísticos que le permitan leer crítica y comprensivamente los resultados cientificos ajenos.

La naturaleza del trabajo clínico es por naturaleza probabilística o estadístico, disciplinas que dan rigor y objetividad a los clásicos procesos de diagnóstico, pronóstico y tratamiento.


El método estadístico permite recolectar, elaborar, analizar e interpretar la multiplicidad de fenómenos individuales y colectivos, sin el cual sería imposible llegar a generalizaciones.

Luego, la bioestadística es una herramienta del investigador y del profesional en general, y del profesional de la salud en especial, para poder comprender, explicar y transformar la realidad








ESTADISTICA, BIOESTADISTICA Y METODO CIENTIFICO

La palabra estadística tiene varios significados: datos o cifras, proceso de análisis de datos y la descripción de un campo de estudio.

En plural el término Estadísticas es sinónimo de datos numéricos, mientras que Estadística, en singular, es el método de recolectar, elaborar, analizar e interpretar datos numéricos

Pero cuando nos referimos a las ciencias biológicas y de la salud, se utiliza el término Bioestadística.


EJEMPLO DE APLICACION


No es difícil encontrar ejemplos en la literatura médica la manera como los pasos anteriores se aplican en la investigación. Considérese al respecto, el descubrimiento
del bacilo tuberculoso:

Koch observó ciertas formas bacilares en los esputos de pacientes tuberculosos (primer paso).

Como hipótesis de trabajo atribuyó a ellas la causa de la enfermedad (segundo paso),
lo cual demostró más tarde, al comprobar que el bacilo se encontraba en los esputos de individuos tuberculosos y nunca en los procedentes de individuos sin la enfermedad
(tercer paso)(2

DEDUCCIONES

Es indiscutible que la estadística cumple diferente papel en cada uno de los 3 pasos fundamentales del método científico, siendo especialmente importante en la observación de los fenómenos, ayudando a que la observaciòn sea fidedigna y exacta, previniendo de las fuentes de error que pueden estar en el objeto observado, en el mètodo utilizado, o en el observador.

Tambièn es importante la funciòn que desempeña la estadìstica en la prueba y verificación de las hipótesis .



CLASIFICACION DE INFORMACION Y REPRESENTACION GRAFICA


Las escalas son estructuras que permiten la clasificación de la información y su posterior análisis, por eso se requiere que estén bien constituidas, sea cual sea el tipo
de escala o de variable y reunir las siguientes condiciones :

Exhaustiva, es decir, debe permitir la clasificación de cualquier individuo que se estudia, por ejemplo: Una escala que dividiera las razas solamente en BLANCA Y NEGRA, sería incompleta, no exhaustiva.

Excluyente. Que las divisiones y subdivisiones o categorías Sean mutuamente excluyentes, es decir, un dato solo puede Ser ubicado en una sola categorìa o clase.

COMPONENTES DE UNA TABLA (COMO LA ANTERIOR)

Número Contenido
Titulo Total
Encabezamiento Línea de cierre

El número (No.) corresponde a las frecuencias absolutas, y el porcentaje (%) a las frecuencias relativas.


VARIABLES

Es cualquier atributo, fenómeno, hecho que puede tener diferentes valores


Binaria
Discreta
Continua
TIPO DE VARIABLES Independiente
Dependiente
Intermedia
Extraña


V. Binaria : Que solo puede tomar uno de dos valores, ejm. Si ( ) No ( )

V. Discreta: Que solo admite enteros, unidades completas ejm.(nùmero de hijos)

V. Continua No presenta interrupciones, usa valores intermedios ejm. (peso, talla)

V.Independiente: Que ejerce una influencia sobre otra variable, es la causa de un evento. Diabetes y E.C.V. Variables independiente = diabetes, y variables dependiente= ECV

V. Dependiente: Variable cuyo cambio depende de la acciòn de otra variable.

V. Intermedia: Que se asocia con la variable dependiente e independiente








MEDIDAS DE TENDENCIA CENTRAL Y DE DISPERSION

Una medida de tendencia central es un único número que indica el centro de una serie de números a partir de los cuales se calcula. tambièn se denominan medidas de localizaciòn o de resumen.

Las tres medidas de tendencia central màs utilizadas son : la media aritmètica, la mediana y la moda:


LA MEDIA ARITMETICA

Es la sumatoria de un conjunto de puntajes dividida entre el nùmero de puntajes, es decir que la media se calcula sumando los valores para los cuales se desea la media y dividiendo el resultado por el nùmero de valores que entran en la suma.

Si representamos la media con el símbolo ‾x, podemos indicar su càlculo con la siguiente fòrmula:

∑ Xi
X‾ = =-----------
n

Donde X = la media
∑ = signo de sumatoria
Xi = puntajes individuales
n = tamaño de la muestra

MEDIANA (Me)

La mediana es aquel valor que se encuentra en la mitad de una muestra o población cuyos valores estàn ordenados de acuerdo a su magnitud. Si el nùmero de valores es impar,la mediana es aquel valor que se encuentra en la mitad de Mediana es igual en la mitad. Si el nùmero de valores es par, la mediana es igual a la media de los dos valores que quedan en la mitad.
De esta manera la mediana divide las observaciones en dos mitades.
Pasos para calcular la mediana cuando el nùmero de puntajes del conjunto es impar:
Ordene los puntajes del màs bajo al màs alto Cuente el nùmero de puntajes
Escoja el puntaje que està en medio, y esa es la mediana.

31, 33, 35, 38, 40, 41, 42, 43, 44, 46, 47, 48, 49, 50, 51

El octavo puntaje de la serie es la mediana, y su valor es de 43.


LA MODA (Mo)

La moda es el puntaje que ocurre con màs frecuencia en un grupo de datos. Claro està que no es el nùmero de veces que ocurre el puntaje, sino el mismo dato. Por ejemplo, si tenemos el siguiente conjunto de edades en años de 15 estudiantes podemos identificar la moda:

20, 23, 19, 23, 24, 18, 24, 21, 25, 26, 23, 28, 17, 31,24

En este caso la serie es bimodal porque existen dos valores que se repiten tres veces, que son 23 y 24.

Un grupo de datos puede no tener ninguna moda o tener màs de una. Esto no ocurre con la media y la mediana, medidas que, para un conjunto de datos, siempre existen y son ùnicas.

MEDIDAS DE VARIABILIDAD O DISPERSION

Acabamos de ver còmo un conjunto de puntajes se puede representar de varias formas, por ejemplo mediante el promedio, la mediana y la moda.

Pero el promedio no basta para describir un conjunto de puntajes, tambièn se puede saber la menera en que los valores individuales se desvìan del promedio.A esta clase de mediadas se les llama medidas de variabilidad.

La variabilidad es el grado de dispersión que caracteriza a un grupo de puntajes, y es el grado en que un conjunto de puntajesn difiere de una medida de tendencia central, generalmente la media.
Las principales medidas de dispersión o variabilidad son: rango o intervalo, desviación estàndar y varianza.


EL RANGO

Es la medida màs simple de variabilidad, que es la diferencia entre el valor màximo
y el valor mìnimo de un conjunto de datos. Por ejemplo, para un conjunto de edades como el siguiente:

24, 34, 18, 25, 35, 32, 45, 36, 48, 20, 37, 32, 56, 28, 53, 40


El rango es 38 ( o sea, 56 – 18), siendo 56 el valor màximo y 18 el valor mìnimo.

El rango tiene un valor limitado como medida de variabilidad porque solamente tienen en Cuenta valores extremos de un conjunto de datos y no da ningún indicio sobre la forma como varìan los valores en el interior del intervalo.

DESVIACION ESTANDAR

Es la medida de variabilidad o de dispersiòn de uso màs comùn. por ejemplo. si tenemos la siguiente cifras: 20, 20, 20, 20, 20 y 20, no hay variabilidad, por tanto la desviación estàndar es cero. Pero cuando los datos no son iguales existe una variaciòn que se Calcula con siguiente fòrmula:
_________
S = √ _
∑( X – X)²
--------------
N - 1
Donde s = desviación estàndar , tambièn se simboliza como DE
∑ = signo de sumatoria X = media de la distribución
X = puntaje bruto, N = tamaño de la muestra

Si tenemos los siguientes puntajes: 15, 20 y 25 la media es 20 y la desviación estàndar es ± 5 porque de 20 a 25 hay cinco puntos màs, y de 20 a 15 hay cinco puntos menos.


VARIANZA
Medida de variabilidad de una distribución que es igual al cuadrado de la desviación estàndar. La varianza es un componente importante en muchas pruebas estadìsticas deductivas. La varianza se simboliza con una sigma ( s² ) al cuadrado, y se calcula mediante la siguiente fòrmula:
_
( X – X)²
S² = --------------- = DE²
n - 1

La varianza y la desviación tipica de una población se indican por medio de los símbolos σ² y σ respectivamente. La varianza de una población finita de tamaño N se calcula mediante la expresión:
∑ (Xi - μ )²
σ ² =_______________
N




Ayuda a determinar la confiabilidad de la inferencia de que los fenòmenos observados en una muestra ocurriràn tambièn en la poblaciòn de donde se seleccionò la muestra

La estadistica inferencial trabaja con dos tipos de tècnicas: las paramètricas y las no paramètricas

Las tècnicas paramètricas suponen, exigen una distribuciòn normal y otras condiciones de las muestras. A este tipo de tècnicas pertenecen la t de estudent, Prueba F, prueba HSD de Tukey…Estas tècnicas son màs potentes y las inferencias màs fiables.

Las tècnicas no paramètricas tienen una distribuciòn libre, son menos potentes, tienen menor probabilidad de certeza y mayor riesgo de cometer el error tipo B. Pertenecen a este tipo las pruebas Chi-cuadrado, fisher, Mcnemar, Q de Yule, Q de Cochran, Prueba de Wilcoxon…







CONCEPTOS BASICOS DE LA ESTADISTICA INFERENCIAL

MUESTRAL = Conjunto de unidades que constituyen la población.
UNIDADES DE ANALISIS= Cada una de las unidades que constituyen la población.
MUESTRA = Es una parte representativa de la población que, para que sea útil ,debe reflejar sus similitudes y diferencias.
FRACCION MUESTRAL = porcentaje que representa la muestra sobre el total de la población.

POBLACION = Conjunto de unidades o individuos sobre los que se pretende obtene información, puede ser finita (<>de 100.000 )
MARCO PARAMETRO = Son los datos o medidas que se obtienen sobre la distribución de las probabilidades de la población: media, desviación estándar …
ESTADISTICO = Los datos o medidas que se obtienen sobre una muestra y por lo
tanto una estimación de la población.

ERROR MUESTRAL = Es la diferencia entre un estadístico y su parámetro correspondiente.
NIVEL DE CONFIANZA = Probabilidad de que la estimación efectuada se ajuste a la realidad.


Función de probabilidad: función que asigna probabilidades a cada uno de los valores de una variable aleatoria discreta.

Función de densidad de probabilidad: función que mide concentración de probabilidad alrededor de los valores de una variable aleatoria continua.

Función de distribución: función que acumula probabilidades asociadas a una variable aleatoria.

Valor esperado: operador matemático que caracteriza la posición de la distribución de probabilidades. Promedio pesado de los resultados de un experimento.

Varianza: operador que caracteriza la dispersión de la distribución



VARIANZA POBLACIONAL = Cuando la población es más homogénea la varianza es menor, y el número de individuos necesarios para llegar a una conclusión
generalización es también menor.

INFERENCIA ESTADISTICA= Proceso de extraer conclusiones acerca de una población a partir de una muestra de observaciones.
MUESTRA REPRESENTATIVA = Que la distribución de las características en la muestra debe se aproximadamente igual a la distribución de las características en la población.

MUESTREO PROBABILÍSTICO= Son métodos que se basan en la equiprobabilidad, es decir, que todos los individuos tienen la misma probabilidad de ser elegido para formar parte de la muestra, asegurando representatividad.

MUESTREO NO PROBABILISTICO= Son métodos que no garantizan la representatividad de la muestra, y por lo tanto no permiten realizar estimaciones inferenciales sobre la población.














FORMAS DE DISTRIBUCION

FUNCIÓN DE DISTRIBUCIÓN
· Puede tomar cualquier valor (- ¥, + ¥)
· Son más probables los valores cercanos a uno central que llamamos media m
· Conforme nos separamos de ese valor m , la probabilidad va decreciendo de igual forma a derecha e izquierda (es simétrica).
· Conforme nos separamos de ese valor m , la probabilidad va decreciendo de forma más o menos rápida dependiendo de un parámetro s , que es la desviación típica.



POBLACIÓN Y MUESTRA

Población es el conjunto completo de individuos u objetos que tienen alguna característica en común y que se constituyen en el
objeto de estudio. Cuando el investigador tiene en cuenta todo los individuos de un grupo o clase se denomina población, y cuando utiliza una parte de ella se llama muestra.

Muestra es una parte representativa de un conjunto o población
cuyas características puede reproducir en pequeño lo más exactamente posible.
El proceso para escoger parte de la población para que represente a toda ella se llama muestreo.
Una muestra debe ser representativa y adecuada; representativa
Cuando refleja las cararìsteristicas de la poblaciòn de donde es tomada.


Otra característica de una muestra es su adecuación, que se obtiene mediante la selección al azar que evita todo sesgo
y prejuicio de selección.
También se requiere que la muestra sea estadísticamente
proporcional a la magnitud de la población.

Para minimizar las desventajas del muestreo debemos utilizar el muestreo aleatorio al azar; es decir, un muestreo en el que todos y cada uno de los miembros de una población determinada tienen exactamente la misma probabilidad de ser seleccionados para la muestra.El tamaño de la muestra debe alcanzar determinadas proporciones mínimas, fijadas estadísticamente según las leyes de la probabilidad.




CALCULO DEL TAMAÑO DE LA MUESTRA

.Los procedimientos para determinar los tamaños de muestra adecuados depende del tipo y objetivos de la investigación, de
la escala de medición usada y la especificación sobre la
magnitud de los posibles errores y sus probabilidades de ocurrencia.
El tamaño de la muestra debe alcanzar determinadas
proporciones mínimas, fijadas estadísticamente según las leyes de la probabilidad


EL TAMAÑO DE UNA MUESTRA DEPENDE DE:

AMPLITUD DEL UNIVERSO
NIVEL DE CONFIANZA
% DE LA CARACTEISTICA
ERROR ESTIMADO


PROBABILIDADES

Probabilidad es proporción de veces que ocurrirá un suceso o evento si se repite un experimento o una observación en un número de ocasiones bajo condiciones similares.
Probabilidad es el cociente entre casos favorables y casos posibles

CASOS FAVORABLES
p = ……………………………..
CASOS POSIBLES

Un fenómeno o experimento aleatorio es aquel en que las mismas condiciones iniciales producen distintos resultados finales, que son conocidos por anticipado pero que no se puede predecir con certeza el resultado de cada experiencia en particular.

Un experimento aleatorio es el lanzamiento de una moneda, de un dado, la medición de la presión arterial …

Un fenómeno o experimento determinista es aquel en que las mismas condiciones producen los mismos efectos.


La probabilidad se mide por un número entre 0 y 1, si no ocurre nunca, la probabilidad es 0, y si ocurre siempre , la probabilidad es 1.

La probabilidad se expresa como una proporción, como una razón.

UTILIDADDEL CONCEPTO DE PROBABILIDADES

• Permiten entender e interpretar datos que se incluyen en cuadros y gráficos de artículos publicados

• permiten hacer afirmaciones relativas al grado de confianza que se tienen en cálculos como las medidas, las proporciones o los riesgos relativos.

• Entender las probabilidades es indispensable para comprender el significado de los valores de P que se presenta en los artículos de revistas.


• Las probabilideades son una medida de la incertidumbre.

• Es poco probable de obtener 5,4,1 al lanzar tres dados P = 1 / 216

• Es probable que un fumador sea también hipertenso

• Es probable que un niño prematuro nazca con bajo peso.

• Es poco probable que Uribe gane el Premio Nobel de Paz


RELACION ENTRE SUCESOS O EVENTOS

EVENTOS MUTUAMENTE EXCLUYENTES: Dos eventos son mutuamente excluyentes si la presencia de uno impide la de los demás: por ejemplo: una persona no puede tener grupo sanguíneo O y también A. Estas probabilidades se calculan al sumarse las de ambos eventos, lo que se conoce como la regla de la adición de las probabilidades: P ( A ó O)= p(A)+P(O)= 0.43 + 0.42 = 0.85

EVENTOS INDEPENDIENTES: Dos eventos diferentes son eventos independientes, el resultado de uno no tiene efecto en el otro Por ejemplo el género y el grupo sanguíneo. Las probabilidades de los dos eventos independientes son de que se presenten ambos, lo cual constituye la regla de la multiplicación: p (hombre y grupo sanguíneo A) = P (hombre) x P (grupo sanguíneo A)

EVENTOS COMPLEMENTARIOS: En este caso cuando se da el uno, no se da el otro: si cae sello, entonces no cae cara.
EVENTOS INCOMPATIBLES: No se pueden dar al mismo tiempo.:intercepción cuando no hay elementos comunes.

PROBABILIDADES CONDICIONADAS. Los eventos no son independientes y se pretende conocer la probabilidad del evento A dado el evento B= p (A/B :Si el 50% de la población fuma, y el 10% fuma y es hipertenso. Cuál es la probabilidad de que un fumador sea hipertenso?
P (A / B ) = .10 / .50 = 20 %


SENSIBILIDAD Y ESPECIFICIDAD

SENSIBILIDAD = PROPORCION DE VERDADEROS POSITIVOS IDENTIFICADOS POR LA PRUEBA, DEL TOTAL DE ENFERMOS.

ESPECIFICIDAD = PROPORCION DE VERDADEROS NEGATIVOS IDENTIFICADOS POR LA PRUEBA DEL TOTAL DE SANOS
FORMAS DE CALCULARLAS:

PATOLOGIA

SI NO

a b
POSITIVO VP FP

PRUEBA
C d
VN
NEGATIVO FN


a d a d
S = _______ E = ……….. VP+= ………. VP- = ………..
a + c b + d a + b c + d


VALORES PREDICTIVOS

EL VALOR PREDICTIVO POSITIVO DE UN TEST ES LA PROBABILIDAD DE QUE UN PACIENTE CON EL TEST POSITIVO TENGA LA ENFERMEDAD.


EL VALOR PREDICTIVO NEGATIVO ES LA PROBABILIDAD DE QUE UN PACIENTE CON UN TEST NEGATIVO NO TENGA LA ENFERMEDAD

COMO CALCULAR LOS RIESGOS

LA EXPOSICIÓN A DETERMINADOS FACTORES ABRE LAS POSIBILIDADES DE PRESENTAR EL EVENTO A QUE SE ESTÁ EXPUESTO.

BASICAMENTE SE PUEDEN CALCULAR CUATRO TIPOS DE RIESGO:

EXPONENCIAL
NO EXPONENCIAL
RELATIVO
ATRIBUIBLE.

Esto se hace mediante una tabla de 2x 2 o de contingengia o cuadricelular.






6. Conclusiones:

Se rechaza la hipótesis nula (Ho), se acepta la hipótesis alterna (H1) a un nivel de significancia de α = 0.05. La prueba resultσ ser significativa, La evidencia estadística no permite aceptar la hipótesis nula.

La evidencia estadística disponible permite concluir que probablemente existe diferencia entre los dos tratamientos empleados en casos de diarrea aguda.











Promedio antes promedio después ds diferencia
100. 4 kilos s = 11.4 90,7 s = 7.9 Media 9.7 sd = 4.1

Sed = 1.28 t = 7.5