lunes, 28 de mayo de 2012

medidas de tendencia central



MEDIDAS DE TENDENCIA CENTRAL

PARA DATOS NO AGRUPADOS
Aunque una distribución de frecuencias y su representación grafica son verdaderamente muy utiles para teneruna idea global del comportamiento que presentan los datos, es también necesario resumirlos aun mas calculando algunas medidas descriptivas. Estás medidas son valores que se interpretan fácilmente y sirven para realizar un análisis mas profundo y detallado que el obtenido por los resúmenes tabulares y gráficos.



LA MEDIA ARITMÉTICA
Equivale al cálculo del promedio simple de un conjunto de datos. Para diferenciar
datos muestrales de datos poblacionales, la media aritmética se representa con un
símbolo para cada uno de ellos: si trabajamos con la población, este indicador
será μ; en el caso de que estemos trabajando con una muestra, el símbolo será X.

Media aritmética (μ o X): Es el valor resultante que se obtiene al dividir la sumatoria de un conjunto de datos sobre el número total de datos. Solo es aplicable para el tratamiento de datos cuantitativos.

"La media muestral de un conjunto de “n” observaciones x1, x2, . . . ,xn , de una variable X, se representa con el símbolo : "




LA MEDIANA
Mediana (Me): Valor que divide una serie de datos en dos partes iguales. La cantidad de datos que queda por debajo y por arriba de la mediana son iguales.


 "La mediana de un conjunto de observaciones x1 ,x2, x3,……..xn es el valor que divide a un conjunto de datos en dos pares iguales"

Caracteristicas de la mediana:
  1. es un promedio de poscicion no afectado por los valores extremos.
  2. la medina en caso de una distribucion sesgada, no resulta desplazada del punto de tendencia central.


LA MODA
Moda (Mo): indica el valor que más se repite, o la clase que posee mayor frecuencia.

"Es un conjunto de n observaciones x1 ,x2, x3,……..xn, es el valor que se repite con mayor frecuencia"

La moda puede no existir o ser única, las distribuciones que presentan dos o mas máximos relativos se designan  de modo general como bimodales o multimodales.
Características de la moda:
  1. Representa mas  elementos que cualquier otro valor
  2. La moda no permite conocer la mayor parte de los datos
  3. Puede usarse para datos cuantitativos como cualitativos
  4.  La moda como estadístico varia mucho una muestra a otra
  5. Cuando se tienen dos o mas modas es difícil su interpretación

conjuntos


TEORÍA DE CONJUNTOS Y SUS APLICACIONES

La teoría de conjuntos es una rama de las matemáticas que estudia las propiedades de los conjuntos. Los conjuntos son colecciones abstractas de objetos, consideradas como objetos en sí mismas, y son una herramienta básica en la formulación de cualquier teoría matemática.
Más aún, la teoría de los conjuntos es lo suficientemente rica como para construir el resto de objetos y estructuras de interés en matemáticas: números, funciones, figuras geométricas, ...; y junto con la lógica permite estudiar los fundamentos de esta. En la actualidad se acepta que el conjunto de axiomas de la teoría de Zermelo-Fraenkel es suficiente para desarrollar toda la matemática. La propia teoría de conjuntos es objeto de estudio per se, no sólo como herramienta auxiliar, en particular las propiedades y relaciones de los conjuntos infinitos.
En esta disciplina es habitual que se presenten casos de propiedades indemostrables o contradictorias, como la hipótesis del continuo o la existencia de un cardinal inaccesible. Por esta razón, los razonamientos y técnicas de la teoría de conjuntos se apoyan en gran medida en la lógica matemática.
El desarrollo histórico de la teoría de conjuntos se atribuye a Georg Cantor que comenzó a investigar cuestiones conjuntistas "puras" en la segunda mitad del siglo XIX, precedido por algunas ideas de Bernhard Bolzano e influenciado por Richard Dedekind. El descubrimiento de las paradojas de la teoría cantoriana de conjuntos propició los trabajos de Bertrand Russell, Ernst Zermelo, Abraham Fraenkel y otros a principios del siglo XX.

Conceptos básicos de la teoría de conjuntos.
El concepto de conjunto es uno de los pilares fundamentales de la Estadística y la Probabilidad, y en general de toda la Matemática. El conjunto de valores que puede tomar la variable de estudio en toda investigación estadística, así como el conjunto de todos los posibles resultados de un experimento de azar que se está estudiando, son una sencilla muestra de la utilidad y necesidad de comprender la teoría de conjuntos.
Se llama conjunto a una colección o agrupación de objetos que tienen en común alguna propiedad. Tales objetos se denominan elementos o miembros del conjunto. En lo general, se representa a los conjuntos con letra mayúsculas, tales como A, B, C, D, entre otras, y a sus elementos con letras minúsculas, por ejemplo a, b, c, d, por citar algunas.
Cuando un elemento “a” pertenece a un conjunto K, se puede escribir como: a Î K, y si no pertenece se escribe como: a Ï K. Cuando la relación de pertenencia se establece para varios elementos, por ejemplo: si a, b y c pertenecen a K, se puede escribir a, b y c Î K. 
Se debe tener cuidado para definir un conjunto y diferenciar los elementos que lo componen, por otra parte, si el conjunto ya está establecido, se debe ser competente en distinguir si los elementos cumplen con su definición. Para ello, se pueden definir los conjuntos haciendo una lista de todos sus elementos, separándolos por comas y encerrándolos entre llaves, esta forma de hacerlo se llama método por extensión; pero si esto no es posible, entonces se debe describir aquella propiedad que satisfacen todos los elementos que le pertenece, esta manera de hacerlo se denomina método por comprensión. A continuación se verán algunos ejemplos:
a) El conjunto de los número dígitos puede definirse por el método de extensión de la siguiente forma:
{ 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 }
b) Si se lanzan dos dados y se resta al mayor de los números el menor, el conjunto total de resultados, se puede
expresar por extensión de la siguiente manera:
{0, 1, 2, 3, 4, 5}.
c) Si se desea expresar el conjunto de los números primos, se tiene una cantidad infinita de elementos, razón
por la cual es imposible expresar este conjunto por el método de extensión, por tal motivo, se recurre al
método de comprensión,expresando este conjunto como:
{ x / x es un número primo }
El cual se lee: el conjunto de los elementos “x” tales que “x” es un número primo. La línea “ / “ se lee tal que o dado que.
Cualquier conjunto que pueda expresarse por el método de extensión, también se podrá enunciar por el método de comprensión. Otra manera común de escribir los conjuntos por comprensión es enumerando solamente algunos de sus elementos y utilizando puntos suspensivos ( . . . ) para indicar que el mismo patrón se repite; por ejemplo:
a) Sea Q el conjunto de los números pares, se puede expresar así: Q = { 2, 4, 6, 8, . . .}.
Conjuntos especiales:

• Conjunto Universal: En cada problema existe, ya sea de forma establecida o implícita un universo. Tal
conjunto contiene a todos los elementos, de éstos se puede hacer una selección para formar otros conjuntos.
El conjunto Universal se simboliza con la letra U, y muestra de ello son los siguientes ejemplos:

a) El número de sellos al lanzar 3 monedas.
U = {0, 1,2, 3}
b) Los números de Fibonaci.
U = {0, 1, 1, 2, 3, 5, 8, 13, 21,. . .}
c) Los tipos de distribuciones de frecuencias.
U ={absolutas, relativas, acumuladas, relativas acumuladas }.

• Conjunto vacío: Es todo conjunto que no tiene elementos. Se representa con el símbolo Ø o con { }.
Ejemplos:
a) El conjunto formado por todos aquellos números que son pares y primos a la vez, y mayores a 3.
{ }
b) Conjunto formado por todas aquellas series de datos en los cuales la varianza es negativa.
Ø
c) El conjunto de todos los números reales “x” tales que x2 = −1.
Ø


• Conjuntos equivalentes: Dos conjuntos A y B cualesquiera son equivalentes o iguales si contienen los mismos elementos. Se simboliza A = B. Ejemplos:
a) A = { x/x es número impar menor a 10 } y B ={1, 3, 5, 7,9 }, por lo tanto A=B.
b) P = { x/x es una curva que suaviza polígonos en los cuales la media, la moda y la mediana coinciden} y
Q= { Curva normal}, por lo tanto P=Q.
c) T ={ x/x es una medida estadística de tendencia central que puede calcularse para cualquier tipo de
variable} y M = { Moda }, en consecuencia, T=M.


• Conjuntos disjuntos o ajenos: Son aquellos conjuntos que no comparten elementos. Ejemplos:
a) Sea el conjunto A = {x/x es número impar} y el conjunto B ={ x/x es número par }
b) Considere el conjunto C = {x/x es una medida de tendencia central} y el conjunto D ={ x/x es una
medida de dispersión }
c) Q ={ x/x es una sustancia alcalina } y R ={ x/x es una sustancia ácida }



• Subconjuntos: Si cada elemento de un conjunto A también pertenece a un conjunto B, se le llama a A un
subconjunto de B y se simboliza como A Ì B y se lee “A está contenido en B”. Ejemplos:
a) A = { media, moda, mediana } y B ={ x/x es una medida estadística descriptiva }, por lo tanto, B Ì A.
b) A ={ x/x es un Estado fronterizo de México} y B = { x/x es una Entidad federativa de México }, así que, A Ì B.
c) A ={ x/x es una número irracional } y B ={ x/x es un número real }, en consecuencia, A Ì B.


Operaciones entre conjuntos y su representación gráfica.
Entre dos o más conjuntos se pueden efectuar operaciones cuyos resultados se convierten en nuevos conjuntos,entre las operaciones más importantes se tienen las siguientes:


La Unión: Al conjunto de todos los elementos que pertenecen al conjunto A o al conjunto B, o tanto a A como a B, se le llama la unión de A y B, éste se simboliza como A È B.

La Intersección: El conjunto de todos los elementos que pertenecen simultáneamente al conjunto A y al conjunto B, se llama intersección de A y B y se representa como A Ç B. En particular, los conjuntos ajenos o disjuntos se caracterizan por A Ç B =Ø.





La diferencia: El conjunto formado por todos los elementos de A que no pertenecen a B, se llama la diferencia de A yB, se escribe por A – B.

El complemento: El conjunto formado por todos los elementos del conjunto Universo que no pertenecen a un subconjunto dado, por ejemplo, se le llama complemento de A a todos los elementos que están en el conjunto universo y que no están en A, además con Ac o A´.

Diagramas de Venn-Euler: (En honor al matemático Suizo Leonardo Euler y al Matemático Inglés John Venn) El universo U puede representarse geométricamente por el conjunto de puntos dentro de un rectángulo. Los subconjuntos de U se representan por conjuntos de puntos dentro del rectángulo y contenidos en círculos u óvalos. La forma en que estos círculos se sobreponen entre sí, muestra todas las posibles relaciones lógicas entre los conjuntos que representan. Por ejemplo, cuando los círculos se superponen, indican la existencia de subconjuntos con algunas características comunes.
En síntesis los diagramas de Venn-Eulerse utilizan para representar gráficamente las distintas operaciones entre conjuntos.


Tablas y gráficas estadísticas.


En todo estudio o investigación estadística se requiere medir las características en los individuos, objetos o cosas de interés; de esta manera se obtiene una colección de valores de la variable correspondiente; es decir se genera un conjunto de datos; ya sea una población estadística o una muestra estadística.

Es indispensable y útil disponer con métodos de organización y presentación de los datos recopilados que permitan conocer cómo se reparten éstos, entre los posibles valores que puede tomar la variable de interés. Las representaciones tabulares y gráficas, brindan la oportunidad de procesar la información recopilada, aún más, se pueden convertir en instrumentos útiles, puesto que pueden expresar o transmitir, de manera rápida y sencilla, las tendencias o regularidades que manifiesten los datos. 

Las tablas estadísticas permiten resumir la información, en la primera columna aparece la variable de estudio y los valores que pueda tomar, en la o las siguientes columnas aparecen las frecuencias absolutas u otras que el estudio requiera.
Componentes de una tabla estadística:

1. Título: Incluye el objetivo del estudio, también describe la información más importante del estudio como lo es: La variable, la muestra o población y a quién corresponde la muestra.
2. Encabezados: Describen el tipo de información que se refiere en cada columna, puede incluir descripciones tales como las unidades de medida empleadas, el tipo de datos y su alineación, vertical u horizontal.
3. Cuerpo de la tabla: Agrupa el contenido de la información. Constituye el mensaje de la tabla. Es el espacio que contiene los valores de variable, ya sea categóricos o numéricos, los cuales deberán ser siempre
excluyentes, también contiene las frecuencias asociadas a cada uno de éstos valores.
4. Final. En el final se registran los totales.
5. Notas de pie: explican detalles del contenido de la tabla. Por ejemplo se especifica: cómo, quién, en dónde y cuándo se recopilaron los datos.
 Ejemplos:
a) Tipo sanguíneo de los estudiantes de un grupo escolar de bachillerato

Tipo de sangre
Número de alumnos

O Rh
+ 22

O Rh
− 3

A Rh
+ 12

B Rh
+ 8

AB Rh
+ 2

Ns

3
Total
50


Distribuciones de frecuencias.
Las primeras tareas de la Estadística Descriptiva son ordenar, clasificar y resumir los datos obtenidos en alguna investigación, para ello se concentran en tablas de frecuencia que pueden ser de los siguientes tipos:
a) Absoluta.
b) Relativa.
c) Acumulada.
d) Relativa acumulada.
Con el análisis de las distribuciones de frecuencias se puede determinar la tendencia de la variable de estudio. Recordemos que la variable de estudio puede ser nominal, ordinal, discreta o continua, y que esta característica incidirá las construcciones de tablas estadísticas.

Tipos de frecuencias.
Llamaremos Frecuencia Absoluta al número de veces que se repite un mismo dato o valor de una variable. Se simboliza con fa.
La Frecuencia relativa es la proporción de elementos que pertenecen a una categoría o valor de una variable y se obtiene dividiendo su frecuencia absoluta entre el número total de elementos y se representa con el símbolo fr. Se puede expresar en fracción, con valores decimales o en porcentajes.
La frecuencia acumulada de un valor de una variable, es la que se obtiene sumando la frecuencia absoluta
correspondiente a este valor, con las frecuencias absolutas de todos los valores anteriores a él. Se simboliza con fac.
 Se Denomina frecuencia relativa acumulada a un valor de una variable, a la que se obtiene sumando la frecuencia relativa correspondiente a este valor, con las frecuencias relativas de todos los valores anteriores a él. Se simboliza con frac. Se puede expresar en fracción, en forma decimal o en porcentaje.

Ejemplo: La siguiente tabla estadística contiene los diferentes tipos de distribuciones de frecuencias.


Número de computadoras por familia en un fraccionamiento perteneciente al municipio de
San Luis Río Colorado.




Gráficos estadísticos para variables categóricas.
La información concentrada en la tabla de frecuencias se puede representar en una gráfica, la cual se puede convertir
en un recurso visual de vital importancia, ya que permite tener una idea clara, precisa, global y rápida acerca de las
observaciones de una muestra o población.
Existen muchos tipos de gráficas en las que se pueden representar la frecuencia absoluta ( fa ), relativa ( fr ),
acumulada ( fac ) y relativa acumulada ( frac ) con ellas se puede estimar algunos valores a través de una simple
inspección visual.

Los diferentes tipos de gráficas que se pueden usar para representar las observaciones de un determinado problema
y la selección de este tipo, dependen de la variable en estudio; si la variable en estudio es del tipo cualitativo, los
gráficos recomendados son:

a) De barras; horizontales o verticales.
b) Circulares.
c) De anillo.
d) Pictograma.
e) Cartograma.

Si la variable en estudio es de tipo cuantitativo, los gráficos que podemos usar para su representación gráfica son:

a) Diagrama de tallo y hojas.
b) Gráfico de líneas
c) Histogramas.
d) Polígonos de frecuencias.

Componentes de un gráfico
Un gráfico, al igual que una tabla de distribución de frecuencias tiene sus componentes, que son las partes
siguientes:
a) Identificación del gráfico.
b) Título del gráfico.
c) Cuerpo del gráfico o gráfico propiamente dicho (incluye la clave o leyenda de ser necesaria esta).
d) Pie del gráfico.

Las características de estos componentes, salvo el gráfico propiamente dicho, son las mismas de dichos
componentes en la tabla estadística.
La elección del gráfico estará en función del tipo de variable de estudio y de los objetivos que se deseen cubrir al
momento de presentar la información:

Características y sugerencias de uso de los gráficos
Para variables categóricas:
Diagramas de barras: Las barras deben ser de igual anchura y alturas proporcionales a las frecuencias absolutas o
relativas. Se aplican a variables categóricas o también a variables discretas cuando los valores de variable son pocos.
Gráficos circulares: No se utilizan para variables ordinales, el área de cada sector es proporcional a su frecuencia
absoluta o relativa y se pueden construir dividiendo un círculo en tantas porciones como clases o valores de variable
existan, de modo que a cada clase le corresponde un arco de circunferencia proporcional a su frecuencia absoluta o
relativa.




Para distribuir cada clase en la circunferencia se aplica una regla de tres simple relacionando el total de entrevistados (100) a 360º que tiene la circunferencia y de esta relación se determina la parte que le corresponde a cada medio de comunicación, por ejemplo para el sector correspondiente al medio de comunicación Televisión, el cálculo es:
x = Arco del sector
 x =( 360)( 18)/100 = 64.8o


Pictograma: Fáciles de entender, el área de cada modalidad debe ser proporcional a la frecuencia.

Se pueden construir o analizar dos tipos de pictogramas: En el primero, se elige una figura que representa un número de individuos fijado y luego se repite para cada valor de la variable tantas veces como indique su frecuencia absoluta; En el segundo tipo, se representa a diferentes escalas un mismo dibujo. El escalamiento de los dibujos debe ser tal que el área de cada uno de ellos sea proporcional a la frecuencia de cada valor de la variable que representa.


Los cartogramas: Son gráficos realizados sobre mapas, en los que aparecen indicados sobre las distintas zonas cantidades o colores de acuerdo con el carácter que representan. No se recomienda su uso cuando se modifican las dimensiones del mapa

.

Gráfico de línea: Los gráficos de líneas muestran un conjunto de puntos conectados mediante una línea. Los valores se representan por el alto de los puntos con relación al eje Y. Las etiquetas de las categorías se presentan en el eje X. Los gráficos de líneas suelen utilizarse para comparar valores a lo largo del tiempo.






PROBABILIDAD Y ESTADÍSTICA I

COLEGIO DE BACHILLERES
DEL ESTADO DE SONORA

Esta publicación fue
diseñada en Dirección Académica del Colegio de Bachilleres del Estado de Sonora
Blvd. Agustín de Vildósola; Sector Sur. Hermosillo, Sonora, México
La edición consta de 6,556 ejemplares.