ESTADÍSTICA ... Apuntes y Reflexiones
  Analizar los Datos
 

“Tips” para el Análisis de Datos

 

1. Utilice un número de identificación única en cada instrumento de recolección de datos. Numere cada instrumento a ser aplicado con un número de identificación único. Después que se recolecten los datos y se digiten éstos en una base de datos, este número único le ayudará a localizar registros o casos con problemas o de especial interés durante el análisis. 

2. No se salte la verificación y limpieza de los datos. Al examinar un nuevo conjunto de datos, realice una verificación y limpieza de los datos previo al análisis. Como analista, usted debe tener una idea de cómo debería verse la base de datos. 

Ejecute Distribuciones de Frecuencias para todas las variables para buscar, por ejemplo:  

·         ¿Cuántas personas deben ser administradores versus personal?

·         El número promedio de años de educación de la muestra.

·         La proporción de casos de desaparecidos que debe tener para una pregunta que no pertenece a todos. 

Ejecute una serie de Tabulaciones Cruzadas y Comparaciones de Promedios antes de hacer nuevos análisis para buscar:

·         Relaciones incoherentes (como que alguien diga que es una mujer, pero cuya relación con el cabeza de familia es "hijo").

·         Promedios inesperados.

·         Un gran número de valores faltantes. 

3. Mantenga un registro de los análisis que ejecuta.  Al realizar los análisis, mantenga un registro de los procedimientos que realiza o la forma en que ha creado nuevas variables. Este registro le ayudará a reconstruir sus análisis, si surge alguna pregunta y al escribir su informe. 

4. Conozca sus datos. Diferentes procedimientos estadísticos son adecuados según el tipo de variable y su nivel de medición. Hay que conocer a qué tipo pertenece cada variable y en qué nivel de medición se encuentra para que de esta manera seleccionar el procedimiento estadístico adecuado para su análisis. 

5. Procedimientos estadísticos para variables cualitativas con nivel de medición nominal. Las variables cualitativas nominales proporcionan una lista de opciones sin un orden significativo. Los ejemplos incluyen el género, tipo de empresa para la cual una persona trabaja y color de pelo, entre otras. El cálculo de una Media Aritmética (por ejemplo) para una variable cualitativa nominal no tiene sentido. En su lugar, ejecute Distribuciones de Frecuencias y observe las categorías con mayor frecuencia para analizar la información. Para presentar estos datos, haga uso de los Diagramas de Sectores y Gráficos de Barras Simples

6. Procedimientos estadísticos para variables cualitativas con nivel de medición ordinal. Las variables cualitativas ordinales tienen un orden implícito entre las opciones de respuesta. Por ejemplo, cuando se pide una opinión sobre un tema particular, “Muy de acuerdo” significa más que “De acuerdo” aunque se desconoce cuánto más. Ejecute Distribuciones de Frecuencias para analizar este tipo de variables. Los Gráficos de Barras Simples muestran las opciones muy bien en este caso. 

7. Procedimientos estadísticos para variables cuantitativas discretas o continuas con nivel de medición de razón o de intervalo. Las variables cuantitativas tienen un orden implícito y una distancia implícita entre las opciones de respuesta. En una variable como la edad en años, por ejemplo, una diferencia de una unidad es la misma en cualquier parte de la distribución. La diferencia numérica entre 20 y 21 años es la misma que entre 45 y 46 años.

Estas variables se prestan a una gama mucho más amplia de procedimientos estadísticos y de mayor alcance. Para este tipo de variables se pueden calcular un buen número de medidas de resumen como la Media (Aritmética, Geométrica o Harmónica), Mediana, Moda, Cuartiles, Deciles, Centiles, Varianza, Desviación Estándar, etc. Los Histogramas y Polígonos de Frecuencia son los gráficos adecuados para este tipo de variables.

No tenga miedo de usar variables cuantitativas siempre que pueda ya que éstas le darán más información. Si es necesario, siempre se puede transformar una variable cuantitativa en una variable cualitativa (ya sea nominal u ordinal). Sin embargo, hay algunos casos en que es apropiado utilizar una variable cuantitativa, pero el demandado no puede ser capaz o estar dispuesto a responder a la pregunta. Por ejemplo, los ingresos económicos de una persona o familia, son una cuestión sensible y difícil de contestar. Los encuestados se sienten incómodos o no pueden responder a la pregunta exactamente. Para reducir la falta de respuesta, ofrezca a los encuestados una gama de intervalos de ingresos entre los que elegir. 

8. Correlación y Regresión Lineal. Estos procedimientos estadísticos son los más populares para cuando se relacionan 2 o más variables cuantitativas. El Coeficiente de Correlación (r) mide la dirección y fuerza de la relación entre 2 o más variables cuantitativas. Por otro lado, el Coeficiente de Regresión (b) nos indica el cambio que se produce en la variable dependiente (Y) cuando la variable independiente (X) cambia en una unidad.

Al realizar estos análisis en muestras, se deben realizar los test estadísticos (t-test y F-test) correspondientes para conocer si existe Correlación o Regresión entre las variables en la población estudiada.

El Diagrama de Dispersión (sin y con la recta de regresión) es el gráfico adecuado para este tipo de análisis. 

9. Tabulaciones Cruzadas. Son apropiadas cuando se analizan dos o más variables cualitativas. Si las variables son cuantitativas no tiene sentido realizar una tabulación cruzada, ya que éstas tablas tendrían tantas filas o columnas como valores diferentes tuvieran dichas variables, a menos que estas variables cuantitativas se transformen en variables cualitativas. 

Al analizar una tabulación cruzada de una muestra de datos, se debe calcular la probabilidad del estadístico X2 (chi-cuadrado). Si esta probabilidad es de 0.05 o menos (probabilidad estadísticamente significativa), por lo general se considera lo suficientemente pequeña como para creer que la distribución de las frecuencias observadas en la tabla no son el resultado de la casualidad. 

La probabilidad del estadístico X2 para una tabla cruzada no mide la fuerza de la relación, sino que mide que tan probable es que la relación se deba al azar. Cuanto menor es la probabilidad del estadístico X2, más seguro se puede estar que la relación observada es "real".

Si el estadístico X2 es estadísticamente significativo, a continuación debe estudiarse más a fondo la tabulación cruzada para caracterizar el modelo que se observa. Para mostrar estos datos, haga uso de Diagramas de Sectores Múltiples y Gráficos de Barras Múltiples

10. Comparación de Medias. Utilice un t-test para conocer acerca de las diferencias de los promedios entre dos grupos cuando los datos provienen de muestras y cuando la variable dependiente (Y) es continua o de intervalo y la variable independiente (X) es categórica con 2 categorías. ¿Tienen los hombres que reciben un determinado tratamiento más probabilidades de ser más jóvenes que las mujeres que reciben el mismo tratamiento? 

Se puede determinar la edad promedio para cada grupo y observar las diferencias entre los mismos, pero se necesita un procedimiento como el t-test para confirmar si la diferencia observada se debe al azar, o si se puede considerar "real". Si la probabilidad del estadístico t de Student es menor de 0.05, lo normal es concluir que las diferencias en los promedios observados no son debido al azar, y que reflejan diferencias reales. 

Al presentar los resultados de la comparación de promedios, use el Gráfico de Barras de Error donde se grafican las Medias y sus Intervalos de Confianza, es decir,  la precisión con la que las medias se estiman (a menudo con una confianza del 95%). 

Si la variable independiente (X) tiene más de dos categorías por lo cual hay más de 2 grupos que se desean comparar, se deberá utilizar el procedimiento denominado Análisis de la Varianza donde se utilizan tanto el estadístico F de Fisher. Si la probabilidad del estadístico F es menor que 0.05, se puede asegurar que existe al menos una pareja de Medias que son realmente diferentes. Si esto es así, se continuaría con la aplicación de pruebas especiales denominadas pruebas de comparación múltiple a posteriori para conocer las parejas de medias que tienen diferencias estadísticamente significativas. El gráfico adecuado para este tipo de análisis en el Gráfico de Medias.

 
  En TOTAL, desde el 1/10/2009, han habido 24939 visitantes en esta página. ¡MUCHAS GRACIAS POR SU VISITA!  
 
Este sitio web fue creado de forma gratuita con PaginaWebGratis.es. ¿Quieres también tu sitio web propio?
Registrarse gratis