sábado, 20 de septiembre de 2008

Datos agrupados/Tabla de distribución de frecuencias


Distribucion de Frecuencias




Se puede utilizar una distribución de frecuencias ( o también llamada tabla de frecuencias), en donde se asocia a cada dato o subgrupo de datos (llamado intervalo de clase o clase) una frecuencia (número de observaciones que corresponden a cada dato o a cada grupo de datos).

La presentación de los datos puede hacerse en forma ordenada, si son datos:

Cualitativos

Cuantitativos

- Orden alfabético

- Forma creciente (menor al mayor).

- Escribir, primero el que más se repite, luego el que sigue y así sucesivamente.

- Forma decreciente (mayor al menor)

EJEMPLO:

A) Se preguntó a un grupo de alumnos de Ingeniería Electromecánica su materia preferida.

Distrib. de frecuencia


mat

eco

adm

inv

ind

Administracion 6


6

mat

inv

ind

prob

eco

Ing. Econ.

5


5

prob

mat

mat

adm

inv

Ing. Indust.

11


11

eco

mat

prob

ind

prob

Inv. de op. 6


6

mat

prob

ind

ind

inv

Matematicas 12


12

eco

prob

mat

adm

ind

Prob. y est

10


10

mat

ind

mat

inv

ind

Total N = 50


50

adm

prob

mat

ind

prob




mat

eco

adm

ind

prob









Cuantiles

Sabemos que la mediana divide a los datos en dos partes iguales, también tiene interés estudiar otros parámetros , llamados cuantiles, que dividen los datos de la distribución en función de otras cantidades. Los más importantes son los cuartiles, quintiles, deciles y percentiles.

  • Cuartiles: son tres valores que divides la serie de datos en cuatro partes iguales. Se representan por Q1(cuartil primero), Q2 (cuartil segundo) y Q3 (cuartil tercero)
  • Quintiles: son cuatro valores que dividen la serie de datos en cinco partes iguales: K1, K2, K3 y K4.
  • Deciles: Son nueve valores que dividen la serie de datos en 10 partes iguales: D1, D2, ..., D9.
  • Percentiles: son 99 valores que dividen la serie de datos en 100 partes iguales: P1, P2, ..., P99.
  • http://thales.cica.es/rd/Recursos/rd99/ed99-0122-04/escaner/cuantil6.gif

    Cálculo de los cuantiles:

    Debido a que los cuantiles son parámetros del tipo de la mediana, su cálculo se realiza de forma análoga.

    Algunas de las fórmulas son las siguientes:


    Datos no agrupados/Medidas de dispersion

    Rango

    El rango estadístico es la diferencia entre el valor mínimo y el valor máximo en un grupo de números. Para averiguar el rango de un grupo de números:

    • Ordenamos los números según su tamaño.
    • Restamos el valor mínimo del valor máximo.

    Ejemplo

    Para una muestra (1, 45, 50, 55, 100), el dato menor es 1 y el dato mayor es 100. Sus valores se encuentran en un rango de:

    Rango = 100 – 1 =99


    Varianza

    La varianza es una variable estadística que mide la dispersión de los valores respecto a un valor central (media), es decir, la media de las diferencias cuadráticas del las puntuaciones respecto a su media aritmética.

    S_X^2 = \frac{\sum_{i=1}^k (X_i - \bar{X})^2}{n}
    S_X^2 = \frac{1}{n}\sum_{i=1}^k (X_i - \bar{X})^2 \cdot x_i

    Propiedades:

    • La varianza es siempre positiva o 0: S_{X}^2 \geq 0
    • Si a los datos de la distribución les sumamos una cantidad constante la varianza no se modifica.

    Yi = Xi + k

    S_Y^2 = \frac{\sum (Y_i - \bar{Y})^2}{n} = \frac{\sum [(X_i + k) - (\bar{X} + k)]^2}{n} = \frac{\sum (X_i + k - \bar{X} - k)^2}{n} = \frac{\sum (X_i - \bar{X})^2}{n} = S_X^2

    • Si a los datos de la distribución les multiplicamos una constante, la varianza queda multiplicada por el cuadrado de esa constante.

    Y_i = X_i \cdot k

    S_Y^2 = \frac{\sum (Y_i - \bar{Y})^2}{n} = \frac{\sum (X_i \cdot k - \bar{X} \cdot k)^2}{n} = \frac{\sum [k \cdot (X_i - \bar{X})]^2}{n} = \frac{\sum [k^2 \cdot (X_i - \bar{X})^2]}{n} = k^2 \cdot \frac{\sum (X_i - \bar{X})^2}{n} = k^2 \cdot S_X^2

    • Propiedad distributiva: V(X + Y) = V(X) + V(Y)

    Desviacion Estandar

    La varianza a veces no se interpreta claramente, ya que se mide en unidades cuadráticas. Para evitar ese problema se define otra medida de dispersión, que es la desviación estandar, que se halla como la raíz cuadrada positiva de la varianza. La desviación típica nos informa sobre la dispersión de los datos respecto al valor de la media; cuanto mayor sea su valor, más dispersos estarán los datos.

    Desviación estadar muestral: S = \sqrt{\frac{\sum_{i=1}^n (x_i - \bar{x})^2}{n-1}}

    Desviación estadar poblacional: \sigma = \sqrt{\frac{\sum_{i=1}^n (X_i - \mu)^2}{N}}

    jueves, 4 de septiembre de 2008

    Datos no agrupados/Medidas de Tendencia Central

    Medidas de tendencia central.

    Media:

    \bar{X}_n = T(X_1,X_2,...,X_n) = \frac{1}{n} \sum_{i=1}^n X_i = \frac{X_1+X_2+...+X_n}{n}

    Mediana:

    M_e=x_{\frac {(n+1)} {2}} ; si n es impar.

    M_e = \frac {x_{\frac {n} {2}} + x_{\frac {n} {2}+1}}{2}, si n es par.

    Moda:
    La moda es el valor que cuenta con una mayor frecuencia en una distribución de datos. Imagen:Imagenmarcos1.JPG



    miércoles, 3 de septiembre de 2008

    Que es estadistica?

    Estadistica: Es el conjunto de métodos científicos ligados a la toma, organización, recopilación, presentación y análisis de datos, tanto para la deducción de conclusiones como para tomar decisiones razonables de acuerdo con tales análisis.

    Estadística descriptiva: Trata de describir las variables aleatorias en las "muestras".

    Estadística inductiva o inferencial: Trata de la generalización hacia las poblaciones de los resultados obtenidos en las muestras y de las condiciones bajo las cuales estas conclusiones son válidas. Se enfrenta básicamente con dos tipos de problemas:

    • Estimación, que puede ser puntual o por intervalos.
    • Contraste de hipótesis.

    Muestra aleatoria: muestra elegida independientemente de todas las demás, con la misma probabilidad que cualquier otra y cuyos elementos están elegidos independientemente unos de otros y con la misma probabilidad.

    Métodos gráficos de representación de muestras: El método gráfico más frecuente es el histograma, que puede adoptar distintas formas.






    Poblacion y Muestra Aleatoria

    Poblacion:

    En estadistica la población, también llamada universo o colectivo es el conjunto de elementos de referencia sobre el que se realizan las observaciones.

    En epidemologia una población es un conjunto de sujetos o individuos con determinadas características demograficas, de la que se obtiene la muestra o participantes en un estudio epidemologico a la que se quiere extrapolar los resultados de dicho estudio .

    El número de elementos o sujetos que componen una población estadística es igual o mayor que el número de elementos que se obtienen de ella en una muestra (n).


    Muestra:


    Una muestra estadística es un subconjunto de casos o individuos de una poblacion estadistica.

    Las muestras se obtienen con la intención de inferir propiedades de la totalidad de la población, para lo cual deben ser representativas de la misma. Para cumplir esta característica la inclusión de sujetos en la muestra debe seguir una tecnica de muestreo. En tales casos, puede obtenerse una información similar a la de un estudio exhaustivo con mayor rapidez y menor coste.



    Datos no Agrupados: