domingo, 27 de septiembre de 2009

¿què indica cuando la desviaciòn estàndar es màs grande que la media?

La media es susceptible de la distorsión por la presencia de puntuaciones extremas, valores extremos y distribuciones sesgadas. Como se basa en desviaciones de la media, la desviación estándar es susceptible del mismo problema. La distorsión está determinada por el hecho de que las puntuaciones de desviación están elevadas al cuadrado.

Un tipo común de distribución sesgada es un sesgo positivo (o derecho), en el cual la mayoría de las personas tienen bajas puntuaciones, pero algunas obtienen altas puntuaciones. Por ejemplo, “la estancia en el hospital”, o el número de veces que una muestra aleatoria de personas mayores de 65 años han permanecido en un hospital durante el último año, es un sesgo derecho. la mayoría de las personas registrará cero en estancia; algunas ,uno; otras reportarán dos ,y pocas personas muy enfermas, anotarán estancias frecuentes. Este tipo de distribución se presenta en la siguiente tabla.



Incluso sin un histograma, los valores relativos de la media y de la desviación estándar para esta distribución proporcionan una señal de que la distribución sesgada. . Estos estadísticos se calculan como sigue:

X= estancias en el hospital= durante el último año, el número de veces

que una persona es admitida en un hospital y

pasa por lo menos una noche

x¯ =2.41 veces Sx= 3.69 veces n=17 casos

Observe que la desviación estándar es más grande que la media. Esto sugiere que una o más puntuaciones extremas inflaron la media y otra parte la desviación estándar, desde el momento en que se elevan al cuadrado los números en la desviación estándar, unas cuentas puntuaciones extremas pueden hacer “explotar” rápidamente su valor. Note, por ejemplo, la enorme contribución a la suma de cuadrados que los tres casos más grandes hicieron con sus estancias de 9,10 y 10 veces.

¿Por qué una desviación estándar más grande que la media indica un sesgo?

Recuerde que si una distribución no está sesgada (es decir, tiene una forma de campana normal), su rango tendrá una amplitud de aproximadamente 4 a 6 desviaciones estándar. Cuando, la curva es trazada la amplitud de 2 o 3 desviaciones estándar se ajustaran en cada lado de la media. Si el límite inferior de las puntuaciones X de una variable es cero, por lo menos la distancia de 2 desviaciones estándar debería ajustarse entre una puntuación X de cero y la media. Cuando la desviación estándar es más grande que la media, como en el caso de las estancias en el hospital, ni una sola amplitud de la desviación estándar puede lograr este ajuste. Otra manera de explicarlo es que la desviación estándar debería ser alrededor de la mitad del tamaño de la media o más o menos.

Dos reglas generales se aplican a los tamaños relativos de la media y de la desviación estándar:

1. Si la desviación estándar es más grande que la media, esto probablemente indica un sesgo, es decir, la presencia de valores extremos u otra peculiaridad en la forma de la distribución, como una distribución bimodal.

2. Si la desviación estándar no es de la mitad de tamaño de la media o menos, se debe tener cuidado al examinar la distribución para analizar la posible existencia de sesgo o valores extremos.

jueves, 17 de septiembre de 2009

ESTIMACIÓN DE PROMEDIO

Debilidades potenciales de la media: situaciones en las que reportarla sola puede conducir a errores

Cuando se reporta un estadístico de tendencia central, tendemos a suponer que su valor es representativo de puntuaciones típicas en la parte central de una distribución. En ocasiones, sin embargo, cuando se informa la media puede conducir a errores al respecto. Éste es el caso porque el cálculo de la media puede inflarse (aumentar) o desinflarse (disminuir) debido a puntuaciones o valores extremos. Puntuaciones muy altas, o valores extremos positivos, inflan el valor de la media “agrandando” la suma de X (es decir, ΣX) en el numerador de la fórmula. Puntuaciones sumamente bajas en una distribución, o valores extremos negativos, desinflan el valor de la media “encogiendo” ΣX. Por ejemplo, suponga que calculamos la cantidad media del dinero en efectivo que llevan 10 estudiantes. Idealmente, esta media debe indicarnos cuál es la cantidad típica. Pero suponga que un estudiante cobró un cheque por $400 y nuestro cálculo es el siguiente, donde X= la cantidad de dinero en efectivo de cada estudiante (para simplificar, se redondea al dólar más cercano):

Por obvias razones, esta media de $46 no representa la cantidad de dinero promedio típica, o la tendencia central que los alumnos suelen portar en efectivo. La mayoría de los estudiantes tiene menos de $10, y reportar una media de $46 es engañoso.
El cálculo de la media se distorsiona por la presencia de un valor extremo. Para obtener un sentido de proporción sobre cómo se calcula la fórmula de la media, examine la relación entre el numerador (ΣX) y el denominador (n). Cuando ΣX es grande y n es pequeña, la media será grande. Si ΣX es grande debido a la presencia de uno o dos valores extremos de alto valor, la media se “inflará” hasta un valor grande.

Tenga presente que nuestro objetivo es usar estadísticos de muestra para estimar los parámetros de una población. Si se reporta una media muestral inflada o disminuida, se presentará un resumen distorsionado de las puntuaciones que obtienen los sujetos en una población. Esta limitación de la media es un problema especial con muestras pequeñas; cuando menor sea la muestra, mayor será la distorsión que genere un valor extremo. Por ejemplo, calcule la edad media de la siguiente muestra de cinco estudiantes de la universidad local, donde un estudiante en la muestra tiene una edad extremadamente alta: 19, 19, 20, 21, y 54 años. La respuesta dejará la impresión de que esta muestra está bastante arriba de la edad típica en la universidad, cuando, de hecho, cuatro de los cinco estudiantes tiene la edad típica. También observe lo que sucede cuando existe una puntuación sumamente baja, como con esta muestra de edades: 8, 19, 19, 20 y 21 años. En tales casos, los valores extremos deben eliminarse, y la media debe calcularse de nuevo sin ellos. Al informar esta “media ajustada”, notamos por qué se realizó el ajuste.

Debilidades potenciales de la mediana: situaciones en las que reportarla sola puede conducir a errores

La mediana se basa en la ubicación ordenada de puntuaciones en una distribución. Es insensible a los valores de las puntuaciones en una distribución; es decir, sin tener en cuenta los valores de X que la rodean, la mediana es la puntuación de la mitad determinada por el número de puntuaciones (n) en la muestra. Por ejemplo, las siguientes dos distribuciones de puntuaciones en un examen tiene la misma mediana; aunque estén compuestas de puntuaciones muy diferentes.
Afirmar que la calificación promedio del examen en ambas clases es 77 sería impreciso porque sugiere que las dos tuvieron igual desempeño. (De hecho, el aula 2 lo hizo mucho mejor, con una media de 83.6, comparado con una media de 65.2 para el aula 1.) La mediana no se afecta por los valores de X.

Mientras es insensible para valores de las puntuaciones, la mediana es sensible a (o afectada por) cualquier cambio en el tamaño de la muestra. Por ejemplo, suponga que en el aula 1 dos estudiantes hacen el examen tarde; lo realizan mal, que es típico de los estudiantes que llegan tarde a una evaluación. Cuando sus puntuaciones se incluyen en la distribución, la mediana cambia drásticamente de 77 a 51:
Aula 1 (incluye las puntuaciones tardías):


La mediana, entonces, tiene dos debilidades potenciales: 1) es insensible a los valores de las puntuaciones en una distribución, y 2) es sensible a (o afectada por) cualquier cambio en el tamaño de la muestra. Antes de reportar la mediana asegúrese de que ninguna de estas debilidades potenciales lo llevará a conclusiones erróneas.

Debilidades potenciales de la moda: situaciones en las que reportarla sola puede conducir a errores

En general, por sí misma la moda es el estadístico de tendencia central menos útil porque tiene un alcance informativo limitado. Mientras identificar la puntuación que ocurre más frecuentemente, no sugiere nada sobre las puntuaciones que ocurre alrededor de este valor de la puntuación. Así, la moda es muy útil cuando se presenta en conjunción con la mediana y la media. Como veremos más adelante, reportar los tres estadísticos de tendencia central es bastante informativo.
La moda puede ser engañosa cuando se usa sola porque es insensible tanto a los valores de las puntuaciones en una distribución como al tamaño de la muestra. Esto significa que usted puede tener cualquier número de distribución con formas totalmente diferentes, y aun todas podrían tener la misma moda.

Mezcla de subgrupos en el cálculo de la media

Debido a que la media es susceptible de distorsión por valores y puntuaciones extremos, debemos describir claramente qué casos o qué sujetos se incluyen en su cálculo. Organizaciones tales como empresas e instituciones escolares, intencionalmente o no, por lo común informan medias que son irreales. Por ejemplo, el vocero de un distrito escolar público puede informar que el sueldo medio de sus maestros es $45.000. Cuando esto ocurra, los maestros probablemente se reunirán en el aula de descanso de la facultad y se preguntarán entre sí: ¿Quién entre nosotros gana tanto dinero? Por supuesto, los maestros no son tontos. Ellos saben de inmediato que quien realizó los cálculos “mezcló los rangos de estatus”, incluyendo al personal de mayor salario – como consejeros académicos, auxiliares de los directores y directores – todos ellos están certificados como docentes pero rara vez dan clases. Estos administradores quizá hayan sido incluidos porque el “estadístico” simplemente pidió a la computadora calcular el sueldo medio para todos los maestros certificados sin tener en cuenta el rango. Cuando se incluyó este personal bien pagado, sus altos sueldos sesgaron la media. Para evitar tal insensatez estadística, deben informarse por separado las medias para subgrupos distintos.

Mezclar rangos de estatus en ocasiones resulta en una medida que no se ajusta a ningún grupo. Por ejemplo, una compañía puede tener sólo dos rangos de empleados: obreros que promedian cerca de $30.000 dólares al año, y gerentes que promedian cerca de $70.000 dólares al año. Si estos dos grupos son aproximadamente del mismo tamaño, el sueldo medio para la compañía entera estaría cercano a $50.000. Curiosamente, ningún empleado en la compañía gana un sueldo cercano a esa cantidad.

Otro ejemplo es la edad media de asistentes en una clase nocturna de tercer grado en una escuela primaria. La edad media se calculará en 20 años más menos, aunque todos ahí tendrán ocho o nueve años (los niños) o alrededor de treinta (los padres).
La media es ciertamente impropia para resumir esta distribución de edades.

domingo, 6 de septiembre de 2009

EL PROBLEMA DE LOS DENOMINADORES PEQUEÑOS

Se debe tener cuidado al interpretar proporciones y porcentajes basados en grupos sumamente pequeños; los números pequeños en la línea base en reportes de cambio de porcentaje son una particular fuente de confusión. La tabla 1 presenta un ejemplo ficticio de lo que típicamente ocurrió al principio de la epidemia del SIDA.

El cambio de porcentajes se calcula como sigue:

Cambio de porcentaje = # al tiempo 2 - # al tiempo 1

# al tiempo 1


TABLA 1. Cambio del porcentaje en el números de nuevos casos de SIDA informados en un condado, de 1988 a 1989 por genero (datos ficticios)

GENERO

NUNERO DE NUEVOS CASOS EN 1988.

NUMERO DE NUEVOS CASOS EN 1989.

CAMBIO DE PORCENTAJE DE 1988 A 1989

Hombres

78

104

33%

Mujeres

4

7

75%

Total

82

111

35%

La tabla muestra que el incremento de porcentaje en la incidencia del SIDA fue mayor para mujeres que para hombres entre los dos años. Tales estadísticas se reportaron a menudo como evidencia de que la epidemia estaba extendiéndose mucho más rápidamente entre las mujeres que entre los hombres, sugiriendo que el SIDA de repente se había vuelto una enfermedad “femenina”. De hecho, en 1989 solo 7 nuevos casos aparecieron entre mujeres, comparados con 104 en hombres. El aparente fenómeno “femenino” se debió al problema de un denominador pequeño en semejante situación, un buen estadístico simplemente reportaría que había muy pocos casos de mujeres para realizar comparaciones significativas.

domingo, 30 de agosto de 2009

DISTORSION GRAFICA

Los gráficos y los diagramas ofrecen mapas mentales de conjuntos grandes de datos. Los procedimientos para diseñar gráficos son normativos; es decir, diferentes personas tienen ideas distintas respecto de aquello que agrada al ojo. En otras palabras, la presentación pictórica es casi un arte.
Puesto que las normas de presentación de datos son tanto estéticas como técnicas, a menudo son poco claras. Por ejemplo, ¿Qué tan amplias deben ser las barras en un grafico? ¿Debemos utilizar una variedad de colores en las barras? Las convenciones que se aplican a estas y a cuestiones similares son flexibles y con frecuencia siguen una moda. El arte inspira la creatividad y la individualidad.
No obstante, cuando las reglas son poco claras es fácil transgredirlas, intencional o involuntariamente. Por ejemplo, con el amplio surtido de programas gráficos de la computadora disponibles en la actualidad los usuarios a menudo están dispuestos a dejar detalles del grafico en manos del individuo anónimo que diseño el programa. Como resultado los medios de comunicación masiva (en oposición a los estrictamente científicos). Generados de manera instantánea por la computadora. Cuando usted se convierta en un experto en el pensamiento estadístico, empezara a notar que muchos, sino la mayoría de estos “instantáneos”, son poco confiables en el mejor de los casos (es decir abiertos a múltiples interpretaciones, y en el peor, incorrectos.
La siguiente parábola ilustra una distorsión grafica común. El candidato “ficticio” a gobernador Pedro Pérez tenía un cómodo margen de dos a uno en las primeras encuestas electorales, sobre su único serio contendiente, José Vargas. Poco después, sin embargo, la delantera empezó a revertirse. Se rumora que
Pedro Pérez esta a punto de despedirse a su personal de campaña, cuyos miembros temen que sus sueños de gobernar el estado se desvanezcan.
La ultima encuesta señala que la ventaja de Pedro Pérez disminuyo 2 puntos porcentuales, de 43 a 41 porciento, con el 16 porciento a un indeciso y un margen de error de mas o menos 3 por ciento. La competencia se ha vuelto muy cerrada. En su intento por evitar perder sus empleos, los miembros del personal de campaña informan a Pedro las puntuaciones que muestran la fig. 1. (¡si Pedro Pérez se deja llevar por esto, no merece ser gobernador!) ¿Puede identificar todas las cuestiones erróneas en este grafico?



Fig.1
Cartel presentado a Pedro Pérez por su personal de campaña para informar sobre los resultados de la mas reciente encuesta en la campaña para gobernador

domingo, 16 de agosto de 2009

Enlace de la Imaginación estadística con la imaginación sociológica

Normas estadísticas y normas sociales

Una visión equilibrada requiere más que el cálculo matemático cuidadoso. Cuando los seres humanos usan sus ilustres cerebros para calcular proporciones, porcentajes y otras estadísticas, están simplemente esforzándose por obtener una medida de la realidad. Una estadística, sin embargo, no significa mucho por sí misma. Un principio importante de la imaginación estadística es que al hacer interpretaciones estadísticas se deben tener en cuenta las circunstancias de un fenómeno, incluso los valores de la sociedad o algún grupo dentro de ella. Los valores sociales pueden llevar a limitar, o quizás incrementar, la respuesta humana a una estadística. En este sentido, cualquier estadística está sujeta a la cultura, es decir, es normativa: su interpretación depende del lugar, tiempo y cultura donde se observa. Una norma social es una idea compartida de la conducta que es apropiada o inapropiada en una situación dada y en una cultura determinada. En una palabra, una norma es una regla; y las normas son peculiares a una sociedad en particular, a un periodo de la historia y a la situación específica en que la acción ocurre. Lo que se considera correcto o incorrecto, mucho o poco, depende del lugar y tiempo. Por ejemplo, estar desnudo en la ducha es normal; de hecho, sería peculiar bañarse con la ropa. Estar desnudo en el salón de clases, sin embargo, es un comportamiento desviado (o anormal).
Cualquier estadística no tiene sentido si no se establece alguna base de comparación –una norma estadística-. Una norma estadística es una tasa promedio de ocurrencia de un fenómeno. Semejante promedio puede diferir de una sociedad a otra o de un grupo a otro porque cualquier norma estadística es influenciada por normas sociales.
Para algunas mediciones, como aquellas sobre el desempeño cognoscitivo o conductual, el estado de salud y el logro académico, las normas estadísticas son necesarias incluso para dar sentido a una puntuación. Por ejemplo, con pruebas de coeficiente intelectual (pruebas de CI) , las puntuaciones son normadas contra el juicio informado de la comunidad de investigación psicológica sobre lo que constituye la inteligencia promedio. Así, las pruebas de CI a menudo son específicamente diseñadas con una norma estadística de 100, numero con el que estamos familiarizados y nos sentimos cómodos. Una persona con inteligencia presumiblemente promedio puntúa 100, mientras que aquellas que obtienen una puntuación mayor tienen un CI arriba del promedio y quienes presentan una puntuación menor poseen un CI inferior al promedio.

domingo, 9 de agosto de 2009

Las escalas y los niveles de medición

Comenzaremos con un ejemplo que nos introducirá en la idea de naturaleza distinta de las variables. Dada una población puede decirse cuáles de los individuos son solteros, casados, divorciados o cualquiera otra categoría de la variable "estado civil". Pero sobre estos mismos individuos se puede decir cuáles no tienen hijos y cuales sí. Sobre este segundo atributo de las unidades de registro se puede, además medir cuales no tienen hijos, cuales tienen un hijo, cuales dos, etc.…. Ahora bien, si relevamos la característica “tener o no tener hijos” es diferente de si relevamos cuántos hijos tiene, a pesar que las características de interés es la misma. Lo que difiere son las mediciones en los modos en que se manifiesta la variable.

En el caso de "tener hijos", el acto queda restringido a clasificar las unidades de registro y/o análisis que muestran la presencia o ausencia de un atributo; se le puede asignar un número a esta característica, pero no es cuantificable. Son características cualitativas. En el segundo caso, se puede estimar objetivamente no sólo la presencia o ausencia de determinado atributo (tener hijos), sino también la intensidad con que la propiedad se manifiesta, propiedad que se asume en cantidades.

Basándose en esta diferencia entre las formas de clasificar variables por referencia a este criterio de calidad-cantidad, la Estadística distingue, ya en un grado mayor de complejidad, la medición de acuerdo al tipo de escala o nivel de medición, en que se encuentran expresados los atributos que queremos medir.

Se trata de operaciones clasificatorias, o sea, ubicación de las unidades de análisis en clases, clases que tienen ciertas propiedades formales. De estas propiedades se deducen definiciones exactas de las características de la escala mucho más precisas de lo que pueden darse en términos verbales. Estas propiedades pueden formularse en forma más abstracta de lo hasta aquí expresado, mediante un conjunto de axiomas que delinean las operaciones para elaborar las escalas y las relaciones entre los objetos a que se aplican.

Se distinguen cuatro tipos de escala:
Nominal
Ordinal
Intervalo
De razón


A. LA ESCALA NOMINAL

Consiste en clasificar objetos o fenómenos, según ciertas características, tipologías o nombres, dándoles una denominación o símbolo, sin que implique ninguna relación de orden, distancia o proporción entre los objetos o fenómenos.

En la escala nominal los números sólo sirven para distinguir categorías, estos no poseen propiedades cuantitativas y sirven solamente para identificar las clases. Por lo tanto, los numerales utilizados en la clasificación no son cuantitativos. Ni siquiera se puede realizar un orden de las observaciones con sentido.

La medición se da a nivel elemental en estos casos (se dice que es el nivel más bajo de medición)

Los símbolos que designan a los diferentes grupos en una escala nominal pueden intercambiarse sin alterar la información esencial de la escala; debido a esto, las estadísticas de tipo descriptivo admisibles son aquellas que no se alteran por este proceso: el modo, la frecuencia, el conteo, la proporción, etc. Se pueden desarrollar procesos analíticos acerca de la distribución de las categorías, así como la posible relación entre dos o más características clasificadas mediante este tipo de escala que llamaremos “variables cualitativas”.


Ejemplo de escala nominal:

Sexo (1. masculino; 2. femenino)
Tipo de propiedad (1. oficial; 2. privada; 3. mixta; 4. cooperativa)
Departamento de origen (1. Córdoba; 2. Santander; 3. Cundinamarca, etc.….)
Conformidad (1. Si; 0. No)


B. LA ESCALA ORDINAL

Para las mismas personas también se pueden medir propiedades donde la clasificación debe seguir un orden jerárquico. Se trata de la escala ordinal. Con ella se establecen posiciones relativas de los objetos o fenómenos en estudio respecto a alguna característica de interés, sin que se reflejen distancias entre ellos.

Suponga que a los clientes en un negocio se les hace unas preguntas para valorar la calidad del servicio. Los clientes valoran la calidad de acuerdo a las siguientes respuestas: 1 (Muy satisfecho), 2 (satisfecho), 3 (Insatisfecho), 4 (Muy insatisfecho). Estos datos son ordinales. Note que una valoración de 1 no indica que el servicio es dos veces mejor que cuando se da una valoración de 2. Sin embargo podemos decir que la valoración de 1 es preferiblemente mejor que 2, y así en los demás casos.

Puede suceder que los objetos de una categoría de las escala no sean precisamente diferentes a los objetos de otra categoría de la escala, sino que están relacionados entre sí, guardan una relación de jerarquía. Los numerales empleados en las escalas ordinales no son cuantitativos, sino que indican exclusivamente la posición en la serie ordenada y no "cuantifican" la diferencia entre posiciones sucesivas de la escala.

Puesto que cualquier transformación tendiente a conservar el orden no altera la información contenida en una escala ordinal, se dice que la escala es "única hasta una transformación monotónica". Esto es, no importa que números se den a una pareja de clases o a los miembros de esas clases, siempre que el número mayor sea dado a los miembros de la clase mayor o mas preferida. Por supuesto, pueden usarse números menores para grados más preferidos (3. de primera clase, 2. de segunda clase, 1 de tercera clase); en tanto se sea consecuente, es indiferente el uso del número mayor o menor para denotar "mayor" o "mas preferido".

Fundamentalmente, las escalas ordinales se estudian en Estadística, con base en las llamadas "estadísticas de orden" o "estadísticas de rango": máximos, mínimos, mediana, percentiles, etc.


Ejemplo de escala ordinal: satisfacción con el resultado

Muy Satisfecho

Satisfecho

Insatisfecho


Muy insatisfecho






C. LA ESCALA DE INTERVALO

Representa un nivel de medición más preciso, matemáticamente hablando, que las anteriores. No sólo se establece un orden en las posiciones relativas de los objetos o individuos, sino que se mide también la distancia entre los intervalos o las diferentes categorías o clases. En este caso, la medición se ejecuta en el sentido de una escala de intervalo; esto es, si la asignación de números a varias clases de objetos es tan precisa que se sabe la magnitud de los intervalos (distancias) entre todos los objetos de la escala, se ha obtenido una medida de intervalo. Una escala de intervalo está caracterizada por una unidad de medida común y constante que asigna un número real a todos los pares de objetos en un conjunto ordenado. En esta clase de medida, la proporción de dos intervalos cualesquiera es independiente de la unidad de medida y del punto cero. En una escala de intervalo, el punto cero y la unidad de medida son arbitrarios.

La consecuencia de cualquier cambio de los números asociados con los objetos medidos en una escala de intervalo debe preservar no solamente el orden de los objetos sino también las diferencias relativas entre ellos. Esto es, la escala de intervalo es "única hasta una transformación lineal". La escala de intervalo es la primera escala verdaderamente cuantitativa. Las estadísticas paramétricas, son las aplicables a estudios en estas escalas.


Ejemplo de variable intervalo: Etapas Cronológicas:

2050

2000

1950

1900


Suponga que se está interesado en algún período histórico específico y se están haciendo proyecciones demográficas. Se quiere conocer el crecimiento poblacional cada 50 años. Obviamente los datos pueden ser ordenados (semejante a los datos ordinales) en orden ascendente indicando pasado/s y futuro/s sucesivamente. Además, las diferencias entre los valores ordenados pueden ser comparadas. Aquí el intervalo entre los valores de los datos 1900 y 1950 representan un incremento en la historia de 50 años, y lo mismo en los demás intervalos. Hay que tener encuentra que en esta escala no hay un cero absoluto o real, el cero es arbitrario; depende del tipo de calendario que estemos usando.

La presente base de datos tiene por objeto presentar información detallada de la población de los 20 países de América Latina, desglosada por edades simples y años calendario, correspondiente al período 1950 - 2050. Estas estimaciones se generan a partir de las proyecciones nacionales utilizando un procedimiento diseñado en el Área de Demografía del Centro Latinoamericano y Caribeño de Demografía- División de Población (CEPAL/CELADE). Una parte de esta información (1995 - 2005) se publica en este Boletín Demográfico (No. 66) y corresponde a las estimaciones y proyecciones vigentes, sustituyendo así las publicadas en el Boletín Demográfico No. 60 de julio de 1997.

año

Población Total América Latina

1950

160.685.269

2000

507.932.043

2050

800.592.305


D: LA ESCALA DE RAZON


Cuando una escala tiene todas las características de una escala de intervalo y además un punto cero real en su origen, se llama escala de razón. Además de distinción, orden y distancia, ésta es una escala que permite establecer en qué proporción es mayor una categoría de una escala que otra. El cero absoluto o natural representa la nulidad de lo que se estudia.

Los números asociados con los valores de la escala de razón son "verdaderos" números con un verdadero cero; solo la unidad de medida es arbitraria. Así la escala de razón es "única hasta la multiplicación por una constante positiva". Además de los procesos paramétricos básicos de las escalas de intervalo, en las de razón pueden utilizarse estadísticas como la media geométrica, el coeficiente de variación, las que requieren el conocimiento del verdadero valor cero


Ejemplo de variable razón: Número de miembros del hogar ocupado
3
2
1
0

Suponga que se quiere medir los ingresos percibidos por las distintas personas empleadas en una empresa de servicios. Los valores relevados han sido, 2,1 – 2, 2 – 2,3…… en miles de pesos. El orden (ordinal) y la diferencia (intervalo) en el ingreso percibido puede ser comparado, pero también el incremento de lo percibido de 2.0 a 2.1 es de 100 pesos (o 0,1 miles de pesos), el cual es el mismo que el que existe entre 2.2 y 2.3 miles de pesos. También, cuando comparamos los pesos de 2.0 a 2.2 miles de pesos, se encuentra una razón significativa, quien gana 2,2 gana 10 % más que quien gana 2, 0 miles de pesos.

El Número como Nombre, Orden o Medida (tomado de Bar; 2000)

Para Cohen y Nagel (1979), los números pueden tener por lo menos tres usos distintos, como rótulos o marcas de identificación; como signos que indican la posición de un grado en una serie de grados; o como signos que indican las relaciones cuantitativas entre cualidades. De lo dicho se desprende que sólo la última de las acepciones relaciona el número con la medición.

Esta forma de concebir los números conduce a una clasificación de variables o escalas en función de los atributos que presenta una serie numérica. Dichos atributos son, el orden, la distancia y el origen.

Las escalas nominales carecen de todas estas propiedades, y en este caso el número sólo puede adoptarse como nombre o identificación. Las escalas ordinales, como su nombre lo indica, sólo poseen orden, es decir que organizan sus datos a través de las relaciones de igualdad, mayor o menor. Las escalas interválicas poseen atributos de orden, y distancia o estimación precisa de las unidades. Pero carecen de origen, o cero natural, o ausencia de la propiedad. No obstante estas escalas acuden a la utilización del cero convencional. Las escalas proporcionales o racionales son las únicas que cuentan con las tres propiedades y, por lo tanto, se constituyen en verdaderas series numéricas. Las dos últimas clases de escalas son las que realmente miden, no obstante, al carecer las interválicas de cero natural, no pueden establecerse proporciones.

A menudo, datos provenientes de escalas ordinales numéricas son tratados como si fuera información verdaderamente cuantitativa, lo que constituye una falacia, pues no miden, aunque sí clasifican. En este caso se encuadran los tests psicométricos, (las evaluaciones de desempeño, las calificaciones de los alumnos en la facultad[1]), los cuales únicamente pueden estimar el orden de puntuación, pero nunca la distancia entre dos valores. Con mucha frecuencia, las puntuaciones de dichos procedimientos reciben tratamiento de variables interválicas y, consecuentemente, el cálculo de medidas de tendencia central y dispersión, además de otras operaciones derivadas de ellas. Dichas operaciones no son válidas por cuanto asignan a las escalas un status que en realidad no tienen.

EJERCICIOS

1. Identifica las escalas de medición de las siguientes variables, de acuerdo al sistema de categorías que se les ha asignado.


Variable

Categorías

Escala de medición

Nivel educativo

Ninguno

Primaria

Secundaria

Terciaria


Nivel educativo

0 año aprobado

1 año aprobado

2 años aprobados

……


Categoría de ocupación

Patrón

Empleado público

Empleado privado

Cooperativista

Trabajador por cuenta propia

Trabajador familiar no remunerado



2) Indique el nivel de medición de las siguientes variables:

a. Peso físico en kilogramos

b. Tasa de mortalidad infantil: numero de muertes durante el primer año de vida por 1000 nacidos

c. Valoración de autoestima: escala sumativa de 15 reactivos con puntuaciones que oscilan entre 0 y 60

d. Satisfacción laboral: 0= muy insatisfecho, 1= insatisfecho, 2= satisfecho, 3= muy satisfecho

e. Esperanza de vida: numero promedio de años que se espera que los recién nacidos vivan (por lo común ajustado para sexo y edad)