UNIDAD 1



ESTADÍSTICA DESCRIPTIVA


OBJETIVOS PARTICULARES DE LA UNIDAD


Al término de la unidad, el alumno: Aplicará los diferentes métodos de muestreo haciendo énfasis en el muestreo aleatorio simple. Construirá tablas de frecuencia y gráficas de los datos obtenidos en una muestra, como son: gráfica de línea, histograma y polígonos de frecuencia.



TEMAS
1.1 Introducción al muestreo. 
1.2 Poblaciones y muestras. 
1.3 Muestras aleatorias. 
1.4 Elementos de estadística descriptiva.       
1.4.1 Tablas de frecuencia.       
1.4.2 Diagramas de línea, histogramas, polígonos de frecuencia y ojivas.
1.5 Distribuciones muestrales. 
1.6 Medidas de tendencia central.



1.1 Introducción al muestreo. 




En estadística un muestreo es la técnica para la selección de una muestra a partir de una población. En el muestreo, si el tamaño de la muestra es más pequeño que el tamaño de la población, se puede extraer dos o más muestras de la misma población. Al conjunto de muestras que se pueden obtener de la población se denomina espacio muestral. La variable que asocia a cada muestra su probabilidad de extracción

El muestreo: es una herramienta de la investigación científica. Su función básica es determinar que parte de una realidad en estudio (población o universo) debe examinarse con la finalidad de hacer inferencias sobre dicha población

El Muestreo es más que el procedimiento empleado para obtener una o más muestras de una población; el muestreo es una técnica que sirve para obtener una o más muestras de población.

Este se realiza una vez que se ha establecido un marco muestral representativo de la población, se procede a la selección de los elementos de la muestra aunque hay muchos diseños de la muestra.

Al tomar varias muestras de una población, las estadísticas que calculamos para cada muestra no necesariamente serían iguales, y lo más probable es que variaran de una muestra a otra.

  • Muestreo Estadístico: son aquellos que se basan en el principio de equiprobabilidad. Es decir, aquellos en los que todos los individuos tienen la misma probabilidad de ser elegidos para formar parte de una muestra y, consiguientemente, todas las posibles muestras de tamaño n tienen la misma probabilidad de ser elegidas.
  • Muestreo probabilístico: Forman parte de este tipo de muestreo todos aquellos métodos para los que puede calcularse la probabilidad de extracción de cualquiera de las muestras posibles. Este conjunto de técnicas de muestreo es el más aconsejable, aunque en ocasiones no es posible optar por él.
  • Muestreo estratificado: Consiste en la división previa de la población de estudio en grupos o clases que se suponen homogéneos respecto a característica a estudiar. A cada uno de estos estratos se le asignaría una cuota que determinaría el número de miembros del mismo que compondrán la muestra.
  • Muestreo sistemático: Es la elección de una muestra a partir de los elementos de una lista según un orden determinado, o recorriendo la lista a partir de un número aleatorio determinado.
  • Muestreo por conglomerados: Cuando la población se encuentra dividida, de manera natural, en grupos que se suponen que contienen toda la variabilidad de la población, es decir, la representan fielmente respecto a la característica a elegir, pueden seleccionarse sólo algunos de estos grupos o conglomerados para la realización del estudio.
  • Muestreo errático: También se llama sin norma. La muestra se realiza de cualquier forma, valorando únicamente la comodidad o la oportunidad en términos de costes, tiempo u otro factor no estadístico.










1.2 Poblaciones y muestras. 


Población
Es el Conjunto Total de individuos, objetos o eventos que tienen la mismas características y sobre el que estamos interesados en obtener conclusiones. La población estadística, también conocida como universo, es el conjunto o la totalidad de elementos que se van a estudiar.

Los elementos de una población lo conforman cada uno de los individuos asociados, debido a que comparten alguna característica en común.

La población estadística puede ser un conjunto de personas, lugares o cosas reales. Por ejemplo, los adolescentes de un pueblo o los usos posibles del azúcar en recetas de cocina.


Al ser muy complicado realizar un estudio con todos los elementos que conforman una población, sobre todo si es considerada una población infinita, se toma una muestra representativa de la misma para realizar los estudios.

Muestra
Es una parte de la población, la cual se selecciona con el propósito de obtener información. Debe ser “representativo”.
La muestra es una parte representativa de una población donde sus elementos comparten características comunes o similares.

Se utiliza para estudiar a la población de una forma más factible, debido a que se puede contabilizar fácilmente. Cuando se va a realizar algún estudio sobre el comportamiento, propiedades o gustos del total de una población específica, se suelen extraer muestras.


Estos estudios que se realizan a las muestras sirven para crear normas o directrices que permitirán tomar acciones o simplemente conocer más a la población estudiada.

EJEMPLO:

  • Población: Los 1500 Estudiantes de UPIICSA.
  • Muestra: 300 Estudiantes de UPIICSA, de la carrera de Ingeniería industrial

1.3 Muestras Aleatorias





Una Muestra (o Muestra Estadística) es un conjunto de casos o individuos que se extraen de una población estadística.



El objetivo de las muestras es deducir propiedades del total de la población. Para ello es necesario que las muestras sean representativas (obtenidas mediante técnicas de muestreo adecuadas) y evitar así las muestras sesgadas.





Ventajas del Estudio de Muestras



Las principales ventajas de utilizar muestras para el estudio estadístico son:
Reducción de costes: la obtención de una muestra es mucho más barato que el estudio de toda la población
Rapidez: el estudio de una muestra es más rápido que el estudio de toda la población. Esto también es una ventaja para el estudio de propiedades que varían con el tiempo al mitigar el error.

EJEMPLO 1:

Para el estudio del desempleo en una ciudad de un millón de habitantes, se toman como muestras la situación de los miembros de 100 familias aleatoriamente entre los diferentes distritos. Para que la muestra sea representativa el número de muestras por distrito debe ser proporcional al tamaño del mismo y las familias analizadas no estar relacionadas entre sí por proximidad, familiaridad, etc.

EJEMPLO 2:

Para el estudio de hispanohablantes en Estados Unidos se toman como muestras a 3000 personas aleatoriamente. En este caso la elección de una muestra representativa es complicada. Habría que tener en cuenta que en algunos estados puede haber más hispanohablantes que en otros, puede haber más hispanohablantes en determinados estratos sociales que en otros, etc.







1.4 Elementos de la estadística descriptiva.


Estadística descriptiva: Se encarga de la recolección, organización, presentación y análisis de los datos de una población.

Estadística inferencial: Se encarga de analizar la información presentada por la estadística descriptiva mediante técnicas que nos ayuden a conocer, con determinado grado de confianza, a la población. Lo que nos permite tomar decisiones.

Población: Conjunto definido de TODOS los INDIVIDUOS, de donde se observa cierta característica. Al número de integrantes de la población se llama tamaño de la población y se representa con la letra N. Las poblaciones pueden ser finitas o infinitas.

Población Estadística: Conjunto de TODOS los DATOS que se obtienen al realizar la medición de una variable en los elementos de una población.
Muestra: Subconjunto de una población, que intenta reflejar las características de la población lo mejor posible.El número de individuos que integran la muestra, llamado tamaño de la muestra se representa con la letra n.

Individuo: Es el elemento de la población o de la muestra que aporta información sobre lo que se estudia.

Variable: Característica o propiedad de los individuos que se desea estudiar y se puede medir o calificar; cambia o varía con el tiempo en un individuo dado, o cambia o varía de elemento a elemento. Ej. Edad, peso, sexo, estado civil, número de hijos, etc.

Dato: Valor que se obtiene al realizar la medición de la característica de la variable en estudio. Pueden ser univariados, bivariados o multivariados.La naturaleza de los datos pueden ser datos cuantitativos o datos cualitativos.

Datos Cuantitativos (números): Valores obtenidos al medir peso, estatura, temperatura, número de hijos.

Datos Cualitativos (categorías): Se obtienen al calificar la característica en cuestión como el sexo, estado civil, grado máximo de estudios.

Variable Dicotómica: Sólo puede tomar dos valores (sí – no, 0 – 1, hombre – mujer, bueno – malo, encendido – apagado). En la variable CUANTITATIVA se pueden distinguir dos tipos: continua y discreta.

Variable Continua: Si la variable puede tomar cualquier número real entre dos valores dados (decimal o entero). Ej. El peso de un individuo.

Variable Discreta: Si la variable sólo puede tomar números enteros. Ej. El número de hijos de un individuo.



1.4.1 Tablas de frecuencia.      

La tabla de frecuencias (o distribución de frecuencias) es una tabla que muestra la distribución de los datos mediante sus frecuencias. Se utiliza para variables cuantitativas o cualitativas ordinales.

La tabla de frecuencias es una herramienta que permite ordenar los datos de manera que se presentan numéricamente las características de la distribución de un conjunto de datos o muestra.



Construcción de la tabla de frecuencias
1.    En la primera columna se ordenan de menor a mayor los diferentes valores que tiene la variable en el conjunto de datos.
2.    En las siguientes columnas (segunda y tercera) se ponen las frecuencias absolutas y las frecuencias absolutas acumuladas.



Frecuencia absoluta
La frecuencia absoluta (ni) de un valor Xi es el número de veces que el valor está en el conjunto (X1, X2,…, XN).
La suma de las frecuencias absolutas de todos los elementos diferentes del conjunto debe ser el número total de sujetos N. Si el conjunto tiene k números (o categorías) diferentes, entonces:

Frecuencia absoluta acumulada
La frecuencia absoluta acumulada(Ni) de un valor Xi del conjunto (X1, X2,…, XN) es la suma de las frecuencias absolutas de los valores menores o iguales a Xi, es decir:


1.4.2 Diagramas de línea, histogramas, polígonos de frecuencia y ojivas.


      Un Histograma es la representación gráfica de una tabla de frecuencias. El histograma puede ser: de frecuencias absolutas, de frecuencias relativas, de frecuencias absolutas acumuladas y de frecuencias relativas acumuladas.


     Un Polígono de Frecuencia es el nombre que recibe una clase de gráfico que se crea a partir de un histograma de frecuencia. Los histogramas emplean columnas verticales para reflejar las frecuencias, los polígonos de frecuencia se forman uniendo los puntos más altos de cada una de las columnas del Histograma.


    Una Ojiva se utiliza para representar la frecuencia acumulada. Similar al Polígono de frecuencia, se forma o se construye uniendo los puntos más altos de cada columna pero de un Histograma que represente las Frecuencias Acumuladas.



1.5 Distribuciones muestrales. 

En estadística, la distribución muestral es lo que resulta de considerar todas las muestras posibles que pueden ser tomadas de una población. Su estudio permite calcular la probabilidad que se tiene, dada una sola muestra, de acercarse al parámetro de la población. Mediante la distribución muestral se puede estimar el error para un tamaño de muestra dado.


1.6 Medidas de tendencia central.



MEDIA ARITMETICA

Se define media aritmética de una serie de valores como el resultado producido al sumar todos ellos y dividir la suma por el número total de valores. La media aritmética se expresada como .

Dada una variable x que toma los valores x1, x2, ..., xn, con frecuencias absolutas simbolizadas por f1, f2, ..., fn, la media aritmética de todos estos valores vendrá dada por:




MEDIANA

No siempre es representativa de una serie estadística. Para complementarla, se utiliza un valor numérico conocido como mediana o valor central.

Dado un conjunto de valores ordenados, su mediana se define como un valor numérico tal que se encuentra en el centro de la serie, con igual número de valores superiores a él que inferiores. Normalmente, la mediana se expresa como Me.

La mediana es única para cada grupo de valores. Cuando el número de valores ordenados (de mayor a menor, o de menor a mayor) de la serie es impar, la mediana corresponderá al valor que ocupe la posición (n + 1)/2 de la serie. Si el número de valores es par, ninguno de ellos ocupará la posición central. Entonces, se tomará como mediana la media aritmética entre los dos valores centrales.

MODA

En una serie de valores a los que se asocia una frecuencia, se define moda como el valor de la variable que posee una frecuencia mayor que los restantes. La moda se simboliza normalmente por Mo.

Un grupo de valores puede tener varias modas. Una serie de valores con sólo una moda se denomina unimodal; si tiene dos modas, es bimodal, y así sucesivamente.





REFERENCIA: 

No hay comentarios:

Publicar un comentario