Muestreo con Excel

Jul 22, 2020 | DATOS, Investigación de mercados | 0 Comentarios

Para este post utilizaré una plantilla Excel para identificar el error muestral de unos datos que ya tengas, y para definir el tamaño mínimo de la muestra antes de empezar una investigación de mercado. Si ya te suscribiste al blog, esta plantilla la tienes a tu disposición en https://datafluency.academy/plantillas/. Si todavía no te has dado de alta, vete al final de este página y suscríbete para recibir la contraseña y acceder a las plantillas. Utilizaré “calculo error muestral y tamaño muestra”.

¡No te pierdas ningún nuevo vídeo!

Visita mi canal de Youtube

Antes de ver como funciona la plantilla, un rápido apunte sobre como seleccionar una muestra aleatoria en Excel. Tenemos dos opciones: con el complemento “Análisis de datos” o con la función “ALEATORIO()”. Para simplificar, me centraré en esta segunda opción:

  1. al lado de nuestra lista (por ejemplo de personas a entrevistar) insertamos la función “=ALEATORIO()” y la arrastramos hasta el final de nuestra lista.
  2. Dado que cada vez que toquemos algo en el Excel, estos números se vuelven a calcular, los pegamos y copiamos como valores.
  3. Seleccionamos el encabezado de las dos columnas, clicamos “Datos” en la cinta de opciones, y clicamos el símbolo del embudo “Filtro”. Aparecerán dos botones en las celdas. Clicamos el de “Aleatorio” y le damos a “Ordenar de menor a mayor”.
  4. Ya tenemos nuestras personas ordenadas de manera aleatorias, así que podemos escoger los primeros X para encuestarlos.

Ahora vamos a ver como funciona la plantilla Excel. Empezamos por la hoja “MUESTRA”. Hay dos cálculos, uno si estamos hablando de proporciones (% de personas por franja de edad, género…), y otro si estamos hablando de promedios (edad, número de viajes..).  El resultado es la muestra mínima necesaria para que el error máximo sea el que indiquemos.

Para las proporciones:

  • Nivel de confianza: por defecto está en el 95%, y de momento lo dejamos así (lo retomaremos más adelante en las siguientes clases).
  • Proporción: la proporción que esperamos de los datos (por ejemplo, que la mitad de los clientes haya viajado con nuestro tren por primera vez = 50%). Si desconocemos la proporción, dejamos 50%, que es donde tenemos el error máximo.
  • Error: el error máximo que estamos dispuestos a asumir, en el caso de un 1% quiere decir que, si el resultado nos dice 48% de viajeros nuevos, el valor real se encontrará entre 47% y 49%.
  • Población: si conocemos el tamaño de la población lo incluimos.
Muestra mínima según error proporciones
Muestra según error promedio

Para los promedios:

  • Datos de la variable en cuestión: esto sirve para calcular la varianza (cuanto dispersos están los datos). Obviamente es necesario disponer ya de alguna muestra con estos datos, por ejemplo, de otros estudios precedentes. Si no disponemos de esta información no se podrá calcular la muestra.
  • Nivel de confianza: por defecto está en el 95%, y de momento lo dejamos así.
  • Error: el error en valor en unidad de medida de la variable de la que queremos calcular el promedio (si es edad, podemos poner que el error sea de 1 año).
  • Población: si conocemos el tamaño de la población lo incluimos.

Verás que en este fichero Excel aparece también otra hoja, “ERROR”. En este caso nos sirve cuando ya tenemos unos resultados y queremos calcular el error. El procedimiento es similar, lo único que cambia es que no tendremos que especificar el error, sino el tamaño de la muestra que tenemos (o el tamaño del subconjunto de la muestra que estamos analizando).