¿Cómo se generan las bases de datos de números telefónicos para las encuestas?

En el Centro de Investigación y Estudios Políticos no se trabaja directamente con una base de datos de números telefónicos. Los números de teléfono a los que se llama son creados al azar mediante un programa de selección aleatoria de números.

El proceso de selección de la muestra se realiza de muestreo aleatorio estratificado, utilizando la técnica de Random Digit Dialing mediante el método de Mitofsky-Waksberg. En primer momento, se seleccionan de forma aleatoria los bancos de los primeros 4 dígitos, según cada una de las operadoras. Los bancos son seleccionados, según la información establecida en el Plan Nacional de Numeración de la Sutel. Una vez que se seleccionan los bancos de números, se seleccionan los siguientes 4 números para completar el número de teléfono.

Estructura de numeración para los números telefónicos móviles

Los números de teléfono móvil en Costa Rica están compuestos por 8 números, los primeros cuatro números se definen como un banco telefónico. Las 3 principales operadoras telefónicas tienen asignados determinados bancos numéricos. En el cuadro 1 se incluye un extracto del plan nacional de numeración de SUTEL, dónde se especifican los bancos asignados a cada operadora para el caso específico de la telefonía móvil.

AsignaciónTamañoCompañía
6000 20006100 1999999.999Telefónica
6100 20006200 1999999.999Telefónica
6200 20006300 1999999.999Telefónica
6300 20006400 1999999.999Telefónica
6400 20006500 1999999.999Telefónica
7002 00007101 9999999.999Claro
7102 00007201 9999999.999Claro
7202 00007301 9999999.999Claro
8300 0XXX8399 9XXX999.999ICE
8400 0XXX8499 9XXX999.999ICE
8500 0XXX8599 9XXX999.999ICE
8600 0XXX8699 9XXX999.999ICE
8700 0XXX8799 9XXX999.999ICE
8800 0XXX8899 9XXX999.999ICE
8900 0XXX8999 9XXX999.999ICE
Cuadro 1. Asignación del banco numérico por Operadora. Fuente: SUTEL, Plan Nacional de Numeración, 2020.

Diseño muestral

El diseño muestral se basa en un submuestreo, en dos etapas. En la primera etapa se seleccionan los conglomerados con Probabilidad proporcional al tamaño. El muestreo de probabilidad proporcional al tamaño (PPT) es un método de muestreo de una población finita en el que hay una medida de tamaño disponible para cada unidad de población antes del muestreo y donde la probabilidad de seleccionar una unidad es proporcional a su tamaño. (Skinner, 2016). En una segunda etapa se seleccionan los 10 números de 4 dígitos para cada uno de las UPM seleccionadas.

Primera etapa

De acuerdo con las asignaciones del plan nacional de numeración se distribuyen las UPM a cada una de las operadoras y se calcula el tamaño de la UPM. En la primera etapa se seleccionan las UPM que en este caso serán los bancos telefónicos. Esta selección se hace mediante PPT (probabilidad proporcional al tamaño) utilizando como estrato el operador móvil y controlando por el tamaño.

Segunda etapa

Se selecciona de forma aleatoria 10 números de 4 dígitos para cada banco seleccionado. Con estas dos etapas, se utiliza la fórmula del PPT, la cual en dos etapas indica que:

En el trabajo de campo, esta técnica tiene la utilidad de que al llamar a los primeros tres números móviles, si se confirma que esos tres números están inactivos, el banco se puede descartar, y continuar con el siguiente, lo cual disminuye la cantidad de llamadas improductivas.

Tamaño de la muestra

Antes de estimar y determinar el tamaño muestra, se deben realizar algunos ajustes previendo que al llamar números generados al azar es posible que la línea no esté activa, que no sea posible obtener respuesta, o que no se cumplen los requisitos mínimos requeridos (nacionalidad y ser mayor de 18 años). Para obtener una muestra final que tenga un tamaño cercano al deseado, se puede considerar la siguiente expresión revisada en la literatura:


TM: tamaño muestral; ED: cantidad de entrevistas deseadas; %T: porcentaje de teléfonos en uso; %NR: porcentaje de no rechazo; %E: porcentaje ajustado por características del estudio

Pero que se puede realizar por pasos:

TM1: tamaño muestral 1; ED: cantidad de entrevistas deseadas; %T: porcentaje de teléfonos en uso.
TM2: tamaño muestral 2; TM1: tamaño muestral 1; %NR: porcentaje de no rechazo.
TM3: tamaño muestral 3; TM2: tamaño muestral 2; %E: porcentaje ajustado por características del estudio.

Porcentaje de teléfonos en uso

En Costa Rica existe una alta cobertura del servicio de telefonía celular. En total, existen 8.495.585 líneas y con base en la información de las operadoras, en total, existe un total de 15.001.997 líneas disponibles para entregar, lo cual implica que 56,63% de los números están asignados, por lo que se encuentran como teléfonos en uso un 43,37%. Algunas de las razones por las que hay un gran número de líneas inactivas es porque los operadores reservan números que no utilizan, o gran cantidad de líneas prepago se utilizan solo por un tiempo determinado y luego dejan de ser utilizadas.

Porcentaje de no rechazo

Para realizar este ajuste se utilizará el dato por experiencia de encuestas previas realizadas por el CIEP, se sabe que la tasa de no respuesta ronda el 60%, por lo tanto, se utiliza un 40% de tasa de no rechazo.

Porcentaje de ajuste por características de estudio

Este factor toma en cuenta el porcentaje de personas que cumplen con las características deseadas para el estudio en cuestión. En el caso de una encuesta sociopolítica, es necesario que las personas sean mayores a 18 años y de nacionalidad costarricense. Según la ENAHO (2018) en el 98% de las viviendas se tiene al menos una línea celular. Este número abarca al 91% de la población costarricense mayor de 18 años. Del total de personas que han usado un teléfono celular en los últimos 3 meses, se tiene que un 25% no cumplen con los requisitos, además se suma un 10% de números que pueden ser números asociados a comercios, lo cual representa un 35%.

La selección de la muestra se realiza utilizando el software de programación R, versión 4.05., con las librerías sampling, survey pps y dplyr.