Bases de datos de los
estudios de opinión

¿Cómo se generan las bases de datos de números telefónicos que se utilizan para las encuestas?

En el Centro de Investigación y Estudios Políticos no se trabaja directamente con una base de datos de números telefónicos. Los números de teléfono a los que se llama son creados al azar mediante un programa de selección aleatoria de números.

El proceso de selección de la muestra se realiza de muestreo aleatorio estratificado, utilizando la técnica de Random Digit Dialing mediante el método de Mitofsky-Waksberg. En primer momento, se seleccionan de forma aleatoria los bancos de los primeros 4 dígitos, según cada una de las operadoras. Los bancos son seleccionados, según la información establecida en el Plan Nacional de Numeración de la Sutel. Una vez que se seleccionan los bancos de números, se seleccionan los siguientes 4 números para completar el número de teléfono.

Estructura de numeración para los números telefónicos móviles
Los números de teléfono móvil en Costa Rica están compuestos por 8 números, los primeros cuatro números se definen como un banco telefónico. Las 3 principales operadoras telefónicas tienen asignados determinados bancos numéricos. En el cuadro 1 se incluye un extracto del plan nacional de numeración de SUTEL, dónde se especifican los bancos asignados a cada operadora para el caso específico de la telefonía móvil.

Diseño muestral

El diseño muestral se basa en un submuestreo, en dos etapas. En la primera etapa se seleccionan los conglomerados con Probabilidad proporcional al tamaño. El muestreo de probabilidad proporcional al tamaño (PPT) es un método de muestreo de una población finita en el que hay una medida de tamaño disponible para cada unidad de población antes del muestreo y donde la probabilidad de seleccionar una unidad es proporcional a su tamaño. (Skinner, 2016). En una segunda etapa se seleccionan los 10 números de 4 dígitos para cada uno de las UPM seleccionadas.

Primera etapa
De acuerdo con las asignaciones del plan nacional de numeración se distribuyen las UPM a cada una de las operadoras y se calcula el tamaño de la UPM. En la primera etapa se seleccionan las UPM que en este caso serán los bancos telefónicos. Esta selección se hace mediante PPT (probabilidad proporcional al tamaño) utilizando como estrato el operador móvil y controlando por el tamaño.

Segunda etapa
Se selecciona de forma aleatoria 10 números de 4 dígitos para cada banco seleccionado. Con estas dos etapas, se utiliza la fórmula del PPT, la cual en dos etapas indica que

En el trabajo de campo, esta técnica tiene la utilidad de que al llamar a los primeros tres números móviles, si se confirma que esos tres números están inactivos, el banco se puede descartar, y continuar con el siguiente, lo cual disminuye la cantidad de llamadas improductivas.

Tamaño de la muestra
Antes de estimar y determinar el tamaño muestra, se deben realizar algunos ajustes previendo que al llamar números generados al azar es posible que la línea no esté activa, que no sea posible obtener respuesta, o que no se cumplen los requisitos mínimos requeridos (nacionalidad y ser mayor de 18 años).
Para obtener una muestra final que tenga un tamaño cercano al deseado, se puede considerar la siguiente expresión revisada en la literatura:

Pero que se puede realizar por pasos:

Porcentaje de teléfonos en uso
En Costa Rica existe una alta cobertura del servicio de telefonía celular. En total, existen 8.495.585 líneas y con base en la información de las operadoras, en total, existe un total de 15.001.997 líneas disponibles para entregar, lo cual implica que 56,63% de los números están asignados, por lo que se encuentran como teléfonos en uso un 43,37%. Algunas de las razones por las que hay un gran número de líneas inactivas es porque los operadores reservan números que no utilizan, o gran cantidad de líneas prepago se utilizan solo por un tiempo determinado y luego dejan de ser utilizadas.

Porcentaje de no rechazo
Para realizar este ajuste se utilizará el dato por experiencia de encuestas previas realizadas por el CIEP, se sabe que la tasa de no respuesta ronda el 60%, por lo tanto, se utiliza un 40% de tasa de no rechazo.

Porcentaje de ajuste por características de estudio
Este factor toma en cuenta el porcentaje de personas que cumplen con las características deseadas para el estudio en cuestión. En el caso de una encuesta sociopolítica, es necesario que las personas sean mayores a 18 años y de nacionalidad costarricense. Según la ENAHO (2018) en el 98% de las viviendas se tiene al menos una línea celular. Este número abarca al 91% de la población costarricense mayor de 18 años. Del total de personas que han usado un teléfono celular en los últimos 3 meses, se tiene que un 25% no cumplen con los requisitos, además se suma un 10% de números que pueden ser números asociados a comercios, lo cual representa un 35%.

La selección de la muestra se realiza utilizando el software de programación R, versión 4.05., con las librerías sampling, survey pps y dplyr.