domingo, 30 de agosto de 2009

DISTORSION GRAFICA

Los gráficos y los diagramas ofrecen mapas mentales de conjuntos grandes de datos. Los procedimientos para diseñar gráficos son normativos; es decir, diferentes personas tienen ideas distintas respecto de aquello que agrada al ojo. En otras palabras, la presentación pictórica es casi un arte.
Puesto que las normas de presentación de datos son tanto estéticas como técnicas, a menudo son poco claras. Por ejemplo, ¿Qué tan amplias deben ser las barras en un grafico? ¿Debemos utilizar una variedad de colores en las barras? Las convenciones que se aplican a estas y a cuestiones similares son flexibles y con frecuencia siguen una moda. El arte inspira la creatividad y la individualidad.
No obstante, cuando las reglas son poco claras es fácil transgredirlas, intencional o involuntariamente. Por ejemplo, con el amplio surtido de programas gráficos de la computadora disponibles en la actualidad los usuarios a menudo están dispuestos a dejar detalles del grafico en manos del individuo anónimo que diseño el programa. Como resultado los medios de comunicación masiva (en oposición a los estrictamente científicos). Generados de manera instantánea por la computadora. Cuando usted se convierta en un experto en el pensamiento estadístico, empezara a notar que muchos, sino la mayoría de estos “instantáneos”, son poco confiables en el mejor de los casos (es decir abiertos a múltiples interpretaciones, y en el peor, incorrectos.
La siguiente parábola ilustra una distorsión grafica común. El candidato “ficticio” a gobernador Pedro Pérez tenía un cómodo margen de dos a uno en las primeras encuestas electorales, sobre su único serio contendiente, José Vargas. Poco después, sin embargo, la delantera empezó a revertirse. Se rumora que
Pedro Pérez esta a punto de despedirse a su personal de campaña, cuyos miembros temen que sus sueños de gobernar el estado se desvanezcan.
La ultima encuesta señala que la ventaja de Pedro Pérez disminuyo 2 puntos porcentuales, de 43 a 41 porciento, con el 16 porciento a un indeciso y un margen de error de mas o menos 3 por ciento. La competencia se ha vuelto muy cerrada. En su intento por evitar perder sus empleos, los miembros del personal de campaña informan a Pedro las puntuaciones que muestran la fig. 1. (¡si Pedro Pérez se deja llevar por esto, no merece ser gobernador!) ¿Puede identificar todas las cuestiones erróneas en este grafico?



Fig.1
Cartel presentado a Pedro Pérez por su personal de campaña para informar sobre los resultados de la mas reciente encuesta en la campaña para gobernador

domingo, 16 de agosto de 2009

Enlace de la Imaginación estadística con la imaginación sociológica

Normas estadísticas y normas sociales

Una visión equilibrada requiere más que el cálculo matemático cuidadoso. Cuando los seres humanos usan sus ilustres cerebros para calcular proporciones, porcentajes y otras estadísticas, están simplemente esforzándose por obtener una medida de la realidad. Una estadística, sin embargo, no significa mucho por sí misma. Un principio importante de la imaginación estadística es que al hacer interpretaciones estadísticas se deben tener en cuenta las circunstancias de un fenómeno, incluso los valores de la sociedad o algún grupo dentro de ella. Los valores sociales pueden llevar a limitar, o quizás incrementar, la respuesta humana a una estadística. En este sentido, cualquier estadística está sujeta a la cultura, es decir, es normativa: su interpretación depende del lugar, tiempo y cultura donde se observa. Una norma social es una idea compartida de la conducta que es apropiada o inapropiada en una situación dada y en una cultura determinada. En una palabra, una norma es una regla; y las normas son peculiares a una sociedad en particular, a un periodo de la historia y a la situación específica en que la acción ocurre. Lo que se considera correcto o incorrecto, mucho o poco, depende del lugar y tiempo. Por ejemplo, estar desnudo en la ducha es normal; de hecho, sería peculiar bañarse con la ropa. Estar desnudo en el salón de clases, sin embargo, es un comportamiento desviado (o anormal).
Cualquier estadística no tiene sentido si no se establece alguna base de comparación –una norma estadística-. Una norma estadística es una tasa promedio de ocurrencia de un fenómeno. Semejante promedio puede diferir de una sociedad a otra o de un grupo a otro porque cualquier norma estadística es influenciada por normas sociales.
Para algunas mediciones, como aquellas sobre el desempeño cognoscitivo o conductual, el estado de salud y el logro académico, las normas estadísticas son necesarias incluso para dar sentido a una puntuación. Por ejemplo, con pruebas de coeficiente intelectual (pruebas de CI) , las puntuaciones son normadas contra el juicio informado de la comunidad de investigación psicológica sobre lo que constituye la inteligencia promedio. Así, las pruebas de CI a menudo son específicamente diseñadas con una norma estadística de 100, numero con el que estamos familiarizados y nos sentimos cómodos. Una persona con inteligencia presumiblemente promedio puntúa 100, mientras que aquellas que obtienen una puntuación mayor tienen un CI arriba del promedio y quienes presentan una puntuación menor poseen un CI inferior al promedio.

domingo, 9 de agosto de 2009

Las escalas y los niveles de medición

Comenzaremos con un ejemplo que nos introducirá en la idea de naturaleza distinta de las variables. Dada una población puede decirse cuáles de los individuos son solteros, casados, divorciados o cualquiera otra categoría de la variable "estado civil". Pero sobre estos mismos individuos se puede decir cuáles no tienen hijos y cuales sí. Sobre este segundo atributo de las unidades de registro se puede, además medir cuales no tienen hijos, cuales tienen un hijo, cuales dos, etc.…. Ahora bien, si relevamos la característica “tener o no tener hijos” es diferente de si relevamos cuántos hijos tiene, a pesar que las características de interés es la misma. Lo que difiere son las mediciones en los modos en que se manifiesta la variable.

En el caso de "tener hijos", el acto queda restringido a clasificar las unidades de registro y/o análisis que muestran la presencia o ausencia de un atributo; se le puede asignar un número a esta característica, pero no es cuantificable. Son características cualitativas. En el segundo caso, se puede estimar objetivamente no sólo la presencia o ausencia de determinado atributo (tener hijos), sino también la intensidad con que la propiedad se manifiesta, propiedad que se asume en cantidades.

Basándose en esta diferencia entre las formas de clasificar variables por referencia a este criterio de calidad-cantidad, la Estadística distingue, ya en un grado mayor de complejidad, la medición de acuerdo al tipo de escala o nivel de medición, en que se encuentran expresados los atributos que queremos medir.

Se trata de operaciones clasificatorias, o sea, ubicación de las unidades de análisis en clases, clases que tienen ciertas propiedades formales. De estas propiedades se deducen definiciones exactas de las características de la escala mucho más precisas de lo que pueden darse en términos verbales. Estas propiedades pueden formularse en forma más abstracta de lo hasta aquí expresado, mediante un conjunto de axiomas que delinean las operaciones para elaborar las escalas y las relaciones entre los objetos a que se aplican.

Se distinguen cuatro tipos de escala:
Nominal
Ordinal
Intervalo
De razón


A. LA ESCALA NOMINAL

Consiste en clasificar objetos o fenómenos, según ciertas características, tipologías o nombres, dándoles una denominación o símbolo, sin que implique ninguna relación de orden, distancia o proporción entre los objetos o fenómenos.

En la escala nominal los números sólo sirven para distinguir categorías, estos no poseen propiedades cuantitativas y sirven solamente para identificar las clases. Por lo tanto, los numerales utilizados en la clasificación no son cuantitativos. Ni siquiera se puede realizar un orden de las observaciones con sentido.

La medición se da a nivel elemental en estos casos (se dice que es el nivel más bajo de medición)

Los símbolos que designan a los diferentes grupos en una escala nominal pueden intercambiarse sin alterar la información esencial de la escala; debido a esto, las estadísticas de tipo descriptivo admisibles son aquellas que no se alteran por este proceso: el modo, la frecuencia, el conteo, la proporción, etc. Se pueden desarrollar procesos analíticos acerca de la distribución de las categorías, así como la posible relación entre dos o más características clasificadas mediante este tipo de escala que llamaremos “variables cualitativas”.


Ejemplo de escala nominal:

Sexo (1. masculino; 2. femenino)
Tipo de propiedad (1. oficial; 2. privada; 3. mixta; 4. cooperativa)
Departamento de origen (1. Córdoba; 2. Santander; 3. Cundinamarca, etc.….)
Conformidad (1. Si; 0. No)


B. LA ESCALA ORDINAL

Para las mismas personas también se pueden medir propiedades donde la clasificación debe seguir un orden jerárquico. Se trata de la escala ordinal. Con ella se establecen posiciones relativas de los objetos o fenómenos en estudio respecto a alguna característica de interés, sin que se reflejen distancias entre ellos.

Suponga que a los clientes en un negocio se les hace unas preguntas para valorar la calidad del servicio. Los clientes valoran la calidad de acuerdo a las siguientes respuestas: 1 (Muy satisfecho), 2 (satisfecho), 3 (Insatisfecho), 4 (Muy insatisfecho). Estos datos son ordinales. Note que una valoración de 1 no indica que el servicio es dos veces mejor que cuando se da una valoración de 2. Sin embargo podemos decir que la valoración de 1 es preferiblemente mejor que 2, y así en los demás casos.

Puede suceder que los objetos de una categoría de las escala no sean precisamente diferentes a los objetos de otra categoría de la escala, sino que están relacionados entre sí, guardan una relación de jerarquía. Los numerales empleados en las escalas ordinales no son cuantitativos, sino que indican exclusivamente la posición en la serie ordenada y no "cuantifican" la diferencia entre posiciones sucesivas de la escala.

Puesto que cualquier transformación tendiente a conservar el orden no altera la información contenida en una escala ordinal, se dice que la escala es "única hasta una transformación monotónica". Esto es, no importa que números se den a una pareja de clases o a los miembros de esas clases, siempre que el número mayor sea dado a los miembros de la clase mayor o mas preferida. Por supuesto, pueden usarse números menores para grados más preferidos (3. de primera clase, 2. de segunda clase, 1 de tercera clase); en tanto se sea consecuente, es indiferente el uso del número mayor o menor para denotar "mayor" o "mas preferido".

Fundamentalmente, las escalas ordinales se estudian en Estadística, con base en las llamadas "estadísticas de orden" o "estadísticas de rango": máximos, mínimos, mediana, percentiles, etc.


Ejemplo de escala ordinal: satisfacción con el resultado

Muy Satisfecho

Satisfecho

Insatisfecho


Muy insatisfecho






C. LA ESCALA DE INTERVALO

Representa un nivel de medición más preciso, matemáticamente hablando, que las anteriores. No sólo se establece un orden en las posiciones relativas de los objetos o individuos, sino que se mide también la distancia entre los intervalos o las diferentes categorías o clases. En este caso, la medición se ejecuta en el sentido de una escala de intervalo; esto es, si la asignación de números a varias clases de objetos es tan precisa que se sabe la magnitud de los intervalos (distancias) entre todos los objetos de la escala, se ha obtenido una medida de intervalo. Una escala de intervalo está caracterizada por una unidad de medida común y constante que asigna un número real a todos los pares de objetos en un conjunto ordenado. En esta clase de medida, la proporción de dos intervalos cualesquiera es independiente de la unidad de medida y del punto cero. En una escala de intervalo, el punto cero y la unidad de medida son arbitrarios.

La consecuencia de cualquier cambio de los números asociados con los objetos medidos en una escala de intervalo debe preservar no solamente el orden de los objetos sino también las diferencias relativas entre ellos. Esto es, la escala de intervalo es "única hasta una transformación lineal". La escala de intervalo es la primera escala verdaderamente cuantitativa. Las estadísticas paramétricas, son las aplicables a estudios en estas escalas.


Ejemplo de variable intervalo: Etapas Cronológicas:

2050

2000

1950

1900


Suponga que se está interesado en algún período histórico específico y se están haciendo proyecciones demográficas. Se quiere conocer el crecimiento poblacional cada 50 años. Obviamente los datos pueden ser ordenados (semejante a los datos ordinales) en orden ascendente indicando pasado/s y futuro/s sucesivamente. Además, las diferencias entre los valores ordenados pueden ser comparadas. Aquí el intervalo entre los valores de los datos 1900 y 1950 representan un incremento en la historia de 50 años, y lo mismo en los demás intervalos. Hay que tener encuentra que en esta escala no hay un cero absoluto o real, el cero es arbitrario; depende del tipo de calendario que estemos usando.

La presente base de datos tiene por objeto presentar información detallada de la población de los 20 países de América Latina, desglosada por edades simples y años calendario, correspondiente al período 1950 - 2050. Estas estimaciones se generan a partir de las proyecciones nacionales utilizando un procedimiento diseñado en el Área de Demografía del Centro Latinoamericano y Caribeño de Demografía- División de Población (CEPAL/CELADE). Una parte de esta información (1995 - 2005) se publica en este Boletín Demográfico (No. 66) y corresponde a las estimaciones y proyecciones vigentes, sustituyendo así las publicadas en el Boletín Demográfico No. 60 de julio de 1997.

año

Población Total América Latina

1950

160.685.269

2000

507.932.043

2050

800.592.305


D: LA ESCALA DE RAZON


Cuando una escala tiene todas las características de una escala de intervalo y además un punto cero real en su origen, se llama escala de razón. Además de distinción, orden y distancia, ésta es una escala que permite establecer en qué proporción es mayor una categoría de una escala que otra. El cero absoluto o natural representa la nulidad de lo que se estudia.

Los números asociados con los valores de la escala de razón son "verdaderos" números con un verdadero cero; solo la unidad de medida es arbitraria. Así la escala de razón es "única hasta la multiplicación por una constante positiva". Además de los procesos paramétricos básicos de las escalas de intervalo, en las de razón pueden utilizarse estadísticas como la media geométrica, el coeficiente de variación, las que requieren el conocimiento del verdadero valor cero


Ejemplo de variable razón: Número de miembros del hogar ocupado
3
2
1
0

Suponga que se quiere medir los ingresos percibidos por las distintas personas empleadas en una empresa de servicios. Los valores relevados han sido, 2,1 – 2, 2 – 2,3…… en miles de pesos. El orden (ordinal) y la diferencia (intervalo) en el ingreso percibido puede ser comparado, pero también el incremento de lo percibido de 2.0 a 2.1 es de 100 pesos (o 0,1 miles de pesos), el cual es el mismo que el que existe entre 2.2 y 2.3 miles de pesos. También, cuando comparamos los pesos de 2.0 a 2.2 miles de pesos, se encuentra una razón significativa, quien gana 2,2 gana 10 % más que quien gana 2, 0 miles de pesos.

El Número como Nombre, Orden o Medida (tomado de Bar; 2000)

Para Cohen y Nagel (1979), los números pueden tener por lo menos tres usos distintos, como rótulos o marcas de identificación; como signos que indican la posición de un grado en una serie de grados; o como signos que indican las relaciones cuantitativas entre cualidades. De lo dicho se desprende que sólo la última de las acepciones relaciona el número con la medición.

Esta forma de concebir los números conduce a una clasificación de variables o escalas en función de los atributos que presenta una serie numérica. Dichos atributos son, el orden, la distancia y el origen.

Las escalas nominales carecen de todas estas propiedades, y en este caso el número sólo puede adoptarse como nombre o identificación. Las escalas ordinales, como su nombre lo indica, sólo poseen orden, es decir que organizan sus datos a través de las relaciones de igualdad, mayor o menor. Las escalas interválicas poseen atributos de orden, y distancia o estimación precisa de las unidades. Pero carecen de origen, o cero natural, o ausencia de la propiedad. No obstante estas escalas acuden a la utilización del cero convencional. Las escalas proporcionales o racionales son las únicas que cuentan con las tres propiedades y, por lo tanto, se constituyen en verdaderas series numéricas. Las dos últimas clases de escalas son las que realmente miden, no obstante, al carecer las interválicas de cero natural, no pueden establecerse proporciones.

A menudo, datos provenientes de escalas ordinales numéricas son tratados como si fuera información verdaderamente cuantitativa, lo que constituye una falacia, pues no miden, aunque sí clasifican. En este caso se encuadran los tests psicométricos, (las evaluaciones de desempeño, las calificaciones de los alumnos en la facultad[1]), los cuales únicamente pueden estimar el orden de puntuación, pero nunca la distancia entre dos valores. Con mucha frecuencia, las puntuaciones de dichos procedimientos reciben tratamiento de variables interválicas y, consecuentemente, el cálculo de medidas de tendencia central y dispersión, además de otras operaciones derivadas de ellas. Dichas operaciones no son válidas por cuanto asignan a las escalas un status que en realidad no tienen.

EJERCICIOS

1. Identifica las escalas de medición de las siguientes variables, de acuerdo al sistema de categorías que se les ha asignado.


Variable

Categorías

Escala de medición

Nivel educativo

Ninguno

Primaria

Secundaria

Terciaria


Nivel educativo

0 año aprobado

1 año aprobado

2 años aprobados

……


Categoría de ocupación

Patrón

Empleado público

Empleado privado

Cooperativista

Trabajador por cuenta propia

Trabajador familiar no remunerado



2) Indique el nivel de medición de las siguientes variables:

a. Peso físico en kilogramos

b. Tasa de mortalidad infantil: numero de muertes durante el primer año de vida por 1000 nacidos

c. Valoración de autoestima: escala sumativa de 15 reactivos con puntuaciones que oscilan entre 0 y 60

d. Satisfacción laboral: 0= muy insatisfecho, 1= insatisfecho, 2= satisfecho, 3= muy satisfecho

e. Esperanza de vida: numero promedio de años que se espera que los recién nacidos vivan (por lo común ajustado para sexo y edad)