Variables Cualitativas
Datos nominales y ordinales:
Las variables pueden ser cualitativas o cuantitativas.
Variables cualitativas: aquellas que no aparecen en forma numérica, sino como categorías o atributos (sexo, profesión, color de ojos) y sólo pueden ser nominales u ordinales.
Variables nominales: lo único que puede hacerse es establecer frecuencias en cada atributo y la igualdad o desigualdad entre los diferentes casos, ver cuál es el grupo que tiene mayor frecuencia alcanzando el concepto de “moda” (y también obtener algunas medidas de asociación cuando se relacionan variables entre sí).
Variables ordinales: recogen la idea de orden pero no tiene sentido realizar operaciones aritméticas con ellas (acuerdo o desacuerdo con un proyecto de ley) ya que no puede medirse distancia entre una categoría y otra. Se puede establecer aquí igualdad y desigualdad, y relaciones como mayor que, y menor que. Puede establecerse orden, pero no medirse distancia dentro de ese orden. La medida estadística de tendencia central más apropiada para estas escalas es la "mediana".
Tabulación: frecuencia absoluta y relativa:
Una de las finalidades de la estadística descriptiva es resumir gran cantidad de información en pocos valores. La distribución de frecuencias consiste en un agrupamiento de datos en categorías ( o clases) que muestren el número de observaciones registradas en cada categoría.
La frecuencia absoluta es el número de observaciones que la variable toma en cada clase. Dicho de otra manera, la frecuencia absoluta de una clase
(con
, siendo k el número
de categorías de la variable) es el número de observaciones que presentan una modalidad perteneciente a esa variable.
| Categorías de la variable |
Frecuencia Absoluta |
|
|
| ... |
... |
|
|
| ... |
... |
|
|
| |
|
Claramente puede verse que las frecuencias son números no negativos. Además, la suma de las frecuencias absolutas es el número total N de observaciones.

La frecuencia relativa es la proporción del valor de la frecuencia absoluta de cada clase en relación al total de las observaciones de la variable. Dicho de otra manera, la frecuencia relativa de la clase
(con
,
siendo k el número de categorías de la variable) es el cociente , entre las frecuencias absolutas de dicha clase y el número total de observaciones

| Categorías de la variable |
Frecuencia Absoluta |
Frecuencia Relativa |
|
|
|
| ... |
... |
... |
|
|
|
| ... |
... |
... |
|
|
|
| |
|
1 |

Si se multiplica la frecuencia relativa por cien, obtenemos el porcentaje de cada categoría en relación al total de casos.

| Categorías de la variable |
Frecuencia Absoluta |
Frecuencia Relativa |
Porcentajes |
|
|
|
|
| ... |
... |
... |
|
|
|
|
| ... |
... |
... |
|
|
|
|
| |
|
1 |
|
La tabla que presenta las clases o categorías de las variable y sus respectivas frecuencias se llama distribución de frecuencias (indica cómo la frecuencia total se distribuye entre las clases).
Gráficos:
El diagrama de barras permite visualizar de manera sencilla la distribución de una variable cualitativa, tanto para frecuencias absolutas como relativas. Sobre el eje horizontal se colocan las clases de la variable y sobre el eje vertical se colocan en una línea continua los valores desde cero hasta el valor máximo alcanzado por la frecuencia más grande de la variable, o un valor que lo sobrepase (esto último en el caso de frecuencias absolutas) Las frecuencias se indican por las alturas de las barras, siendo todas del mismo ancho.
Si se ordenan las clases de mayor a menor según la frecuencia absoluta y se dibujan rectángulos, dando cuenta de la acumulación de clases, se tiene el diagrama de Pareto. Aquí se dibujan dos ejes de las y, en el de la izquierda se mide el nivel alcanzado por la frecuencia absoluta y en el de la derecha se mide de cero a cien para señalar la acumulación de las frecuencias relativas de cada clase con las que le preceden.
El diagrama de torta consiste en un círculo en el que se representan sectores (o porciones) con áreas proporcionales a las frecuencias de cada una de las clases. Se construye tomando ángulos proporcionales a las frecuencias para cada una de las clases.
Los pictogramas, por su parte, son dibujos –generalmente alusivos al tema que se esté midiendo y cuyas áreas son proporcionales al peso relativo que cada categoría guarda sobre el total.
La moda:
La moda o clase modal es el dato o clase de mayor frecuencia. La moda es el valor o el intervalo que se repite más veces en una variable. Dicho de otra manera: es aquel valor o categoría de la variable que presenta la mayor frecuencia en una distribución. Sirve como descripción de la variable en el sentido de ser el dato o clase más representativo por ser el más frecuente. Como puede existir más de una clase o dato con la máxima frecuencia, la moda no es necesariamente única.
Aquellas distribuciones que tienen una sola moda se llaman unimodales; cuando hay dos modas se dice que la distribución es bimodal y si hay más de dos modas la distribución se llama multimodal.
Si bien la moda es la única medida descriptiva importante de las variables nominales, en las ordinales, también podemos calcular la mediana. La mediana es el valor que la variable que deja, por encima y por debajo, el 50% de los casos. Es la categoría o valor de la distribución que posee el orden medio cuando las observaciones
aparecen ordenas según las categorías de la variable. La mediana tiene más sentido de ser hallada en las variables cuantitativas. En el caso de variables cualitativas generalmente lo que conviene es dar porcentajes de clases agrupadas (oponiendo así, por ejemplo, aquellas categorías que muestran aceptación a las que no, de forma de establecer porcentajes diferenciales).
Volver a materiales
|
metodos@liccom.edu.uy
|
actualizado: 24/09/2003 |
|
http://www.liccom.edu.uy/bedelia/cursos/metodos/materiales/estadistica/var_cuali.html |