Informacion

Pros y contras del análisis de datos secundarios

Pros y contras del análisis de datos secundarios

El análisis de datos secundarios es el análisis de datos recopilados por otra persona. A continuación, revisaremos la definición de datos secundarios, cómo pueden ser utilizados por los investigadores y los pros y los contras de este tipo de investigación.

Conclusiones clave: análisis de datos secundarios

  • Los datos primarios se refieren a los datos que los investigadores han recopilado ellos mismos, mientras que los datos secundarios se refieren a los datos recopilados por otra persona.
  • Los datos secundarios están disponibles en una variedad de fuentes, como gobiernos e instituciones de investigación.
  • Si bien el uso de datos secundarios puede ser más económico, los conjuntos de datos existentes pueden no responder todas las preguntas de un investigador.

Comparación de datos primarios y secundarios

En la investigación en ciencias sociales, los términos datos primarios y datos secundarios son lenguaje común. Los datos primarios son recopilados por un investigador o equipo de investigadores para el propósito específico o análisis bajo consideración. Aquí, un equipo de investigación concibe y desarrolla un proyecto de investigación, decide una técnica de muestreo, recopila datos diseñados para abordar preguntas específicas y realiza sus propios análisis de los datos que recopilaron. En este caso, las personas involucradas en el análisis de datos están familiarizadas con el diseño de la investigación y el proceso de recopilación de datos.

El análisis de datos secundarios, por otro lado, es el uso de datos que fue recolectado por otra persona para algún otro propósito. En este caso, el investigador plantea preguntas que se abordan mediante el análisis de un conjunto de datos que no participaron en la recopilación. Los datos no se recopilaron para responder las preguntas de investigación específicas del investigador y, en cambio, se recopilaron para otro propósito. Esto significa que el mismo conjunto de datos puede ser un conjunto de datos primarios para un investigador y un conjunto de datos secundarios para otro.

Usando datos secundarios

Hay algunas cosas importantes que deben hacerse antes de usar datos secundarios en un análisis. Dado que el investigador no recopiló los datos, es importante que se familiaricen con el conjunto de datos: cómo se recopilaron los datos, cuáles son las categorías de respuesta para cada pregunta, si los pesos deben aplicarse o no durante el análisis, si no se deben tener en cuenta los grupos o la estratificación, quién era la población de estudio y más.

Una gran cantidad de recursos de datos secundarios y conjuntos de datos están disponibles para la investigación sociológica, muchos de los cuales son públicos y de fácil acceso. El Censo de los Estados Unidos, la Encuesta social general y la Encuesta de la comunidad estadounidense son algunos de los conjuntos de datos secundarios más utilizados disponibles.

Ventajas del análisis de datos secundarios

La mayor ventaja de usar datos secundarios es que pueden ser más económicos. Alguien más ya ha recopilado los datos, por lo que el investigador no tiene que dedicar dinero, tiempo, energía y recursos a esta fase de investigación. A veces, se debe comprar el conjunto de datos secundarios, pero el costo es casi siempre más bajo que el costo de recopilar un conjunto de datos similar desde cero, lo que generalmente implica salarios, viajes y transporte, espacio de oficina, equipo y otros costos generales. Además, dado que los datos ya se recopilan y generalmente se limpian y almacenan en formato electrónico, el investigador puede pasar la mayor parte de su tiempo analizando los datos en lugar de prepararlos para el análisis.

Una segunda ventaja importante de usar datos secundarios es la amplitud de datos disponibles. El gobierno federal lleva a cabo numerosos estudios a gran escala nacional que los investigadores individuales tendrían dificultades para recopilar. Muchos de estos conjuntos de datos también son longitudinales, lo que significa que se han recopilado los mismos datos de la misma población durante varios períodos de tiempo diferentes. Esto permite a los investigadores observar tendencias y cambios de fenómenos a lo largo del tiempo.

Una tercera ventaja importante de usar datos secundarios es que el proceso de recopilación de datos a menudo mantiene un nivel de experiencia y profesionalismo que puede no estar presente con investigadores individuales o pequeños proyectos de investigación. Por ejemplo, la recopilación de datos para muchos conjuntos de datos federales a menudo es realizada por miembros del personal que se especializan en ciertas tareas y tienen muchos años de experiencia en esa área en particular y con esa encuesta en particular. Muchos proyectos de investigación más pequeños no tienen ese nivel de experiencia, ya que los estudiantes que trabajan a tiempo parcial recopilan muchos datos.

Desventajas del análisis de datos secundarios

Una desventaja importante del uso de datos secundarios es que puede no responder las preguntas de investigación específicas del investigador o contener información específica que el investigador quisiera tener. Es posible que tampoco se haya recolectado en la región geográfica o durante los años deseados, o con la población específica que el investigador está interesado en estudiar. Por ejemplo, un investigador que esté interesado en estudiar adolescentes puede encontrar que el conjunto de datos secundarios solo incluye a adultos jóvenes.

Además, dado que el investigador no recopiló los datos, no tienen control sobre lo que contiene el conjunto de datos. Muchas veces esto puede limitar el análisis o alterar las preguntas originales que el investigador intentó responder. Por ejemplo, un investigador que está estudiando la felicidad y el optimismo podría descubrir que un conjunto de datos secundario solo incluye una de estas variables, pero no ambas.

Un problema relacionado es que las variables pueden haber sido definidas o categorizadas de manera diferente a la que habría elegido el investigador. Por ejemplo, la edad puede haberse recopilado en categorías en lugar de como una variable continua, o la raza puede definirse como "blanca" y "otra" en lugar de contener categorías para cada raza principal.

Otra desventaja significativa del uso de datos secundarios es que el investigador no sabe exactamente cómo se realizó el proceso de recopilación de datos o qué tan bien se llevó a cabo. El investigador no suele estar al tanto de la información sobre qué tan gravemente se ven afectados los datos por problemas como la baja tasa de respuesta o el malentendido de las preguntas específicas de la encuesta. A veces, esta información está fácilmente disponible, como es el caso de muchos conjuntos de datos federales. Sin embargo, muchos otros conjuntos de datos secundarios no están acompañados por este tipo de información y el analista debe aprender a leer entre líneas para descubrir posibles limitaciones de los datos.