07 marzo, 2009

UNIDAD 3 RESUMEN Y ORGANIZACIÓN DE LOS DATOS


Medidas de tendencia central
La MEDIA aritmética o promedio, de una cantidad finita de números, es igual a la suma de todos ellos dividida entre el número de sumandos. Es uno de los principales estadísticos muéstrales.


MEDIANA es el valor de la variable que deja el mismo número de datos antes y después que él, una vez ordenados estos. De acuerdo con esta definición el conjunto de datos menores o iguales que la mediana representarán el 50% de los datos



La MODA se define como aquel valor de la variable al que corresponde máxima frecuencia (absoluta o relativa). Para calcularla, también será necesario distinguir si los datos están o no agrupados.






CUARTILES junto con la mediana, sirven para separar la población en cuatro porciones, cada una de ellas con la cuarta parte de los individuos.
Qq = Lii + q/4 N - Ni-1 * ai









Medidas de dispersión

RANGO se define como la diferencia entre el dato mayor menos el dato menor de un conjunto de datos.
W = x(k) − x(1)









El RANGO INTERCUARTIL es una medida de variabilidad adecuada cuando la medida deposición central empleada ha sido la mediana y él se define como la diferencia entre el TercerCuartil superior y el Primer Cuartil
Rango Intercuartil = Q3 – Q1











La DESVIACIÓN MEDIA es la media de las diferencias en valor absoluto de los valores a la media. Este valor estadístico no es de mucha utilidad en estadística debido a que no es fácil manipular dicha función al no ser derivable.












La VARIANZA, s2, se define como la media de las diferencias cuadráticas de n puntuaciones con respecto a su media aritmética











La DESVIACIÓN ESTÁNDAR es una medida de dispersión para variables de razón y de intervalo, de gran utilidad en la estadística descriptiva











Complemento de Variabilidad

Un CONJUNTO DE DATOS es un conjunto de variables y datos asociados. Se define un conjunto de datos para cada versión del gráfico que desea generar.

DATOS AGRUPADOS
Frecuencia absoluta (ni): Se denomina frecuencia absoluta del valor xi del conjunto de valores de X, el número de veces ni que se repite ese valor.
Frecuencia relativa (fi):Se denomina frecuencia relativa del valor xi del conjunto de valores de X la relación por cociente entre el número de veces que aparece el valor de xi y el número total de valores de X (N), es decir, fi= ni/N
Frecuencia absoluta acumulada (Ni): Se denomina frecuencia absoluta acumulada del valor xi a la suma de las frecuencias absolutas de los valores de conjunto X anteriores o iguales a xi.

Un HISTOGRAMA es el gráfico estadístico que se utiliza para representar unos datos continuos cuando vienen agrupados en intervalos. Sobre cada uno de estos intervalos se levanta una franja tan ancha como el intervalo y de forma que su área sea proporcional a su frecuencia.

Cuando se reúne gran cantidad de datos primarios es útil distribuirlos en clases y categorías y determinar las frecuencias de las clases, o sea, el número de elementos que pertenecen a una clase. El ordenamiento tabular de los datos por clases conjuntamente con las frecuencias de clases se denomina DISTRIBUCIÓN DE FRECUENCIAS
El caso que se describe a continuación, variables discretas se denomina distribución por conteo de valores individuales.

No hay comentarios:

Publicar un comentario