III Metodología

Descripción general de la "Encuesta 30 x 7"


Durante la década de los '90 y en el marco de las estrategias planteadas en el EPI ("Expanded Programme on Immunization", OMS) (8), se realizaron más de 4.000 encuestas en todo el mundo usando un método general simplificado de encuestas por muestreo de conglomerados ("cluster-sample surveys")(9), sugerido por el PAI y denominado "Encuesta 30 x 7"; con el fin de estimar la cobertura de vacunación.

Henderson y Sundaresan, quienes trabajaron ampliamente en esta temática (10), validaron este protocolo de trabajo analizando 60 encuestas llevadas a cabo en 25 países. En el análisis de 33 de estas encuestas, se observó que (11):
- a pesar de que algunas poblaciones eran muy grandes (más de 30.000 habitantes), no se había especificado si se aplicó algún muestreo multietápico y/o estratificado.
- en la mayoría de las encuestas se había definido un rango de 12 a 23 meses de edad.
- la cantidad de hogares visitados había sido muy variable, posiblemente debido a que en poblaciones jóvenes es más probable encontrar los 7 niños de la cohorte de interés, visitando entonces un menor número de hogares.
- en algunas regiones, debido a sus características particulares, se habían realizado modificaciones en el diseño.
- se habían utilizado diferentes fuentes de información al momento de relevar los datos de vacunación (entre ellas: recuerdo de la madre, cicatrices reconocibles de algunas vacunas, carnet de vacunas y registros de vacunación).
- un problema frecuente había sido la imposibilidad de contar con el carnet de vacunas al momento de la entrevista.

La "Encuesta 30 x 7" es un protocolo práctico, estándar y de costos reducidos, que permite obtener estimaciones confiables y comparables para diferentes lugares y distintos períodos de tiempo. Debido a que la implementación de un muestreo simple al azar es muy costosa y de compleja realización, se lleva a cabo un muestreo por conglomerados. Su denominación "30 x 7", deviene del protocolo que implica seleccionar 30 conglomerados (ciudades, pueblos, fracciones o radios censales) y en cada uno de ellos evaluar el estado de vacunación de 7 individuos de la cohorte de interés. 

La elección del tamaño muestral de la “Encuesta 30x7” está respaldada tanto por los resultados obtenidos en numerosas encuestas realizadas a nivel internacional, como por los obtenidos mediante ejercicios de simulación; de tal manera que el citado diseño conduce a la obtención de estimaciones con la precisión requerida por el PAI, organismo internacional que recomienda su utilización.

Población en estudio

Se establecerá un rango de edad de la población a estudiar, que incluya la cohorte de niños de un determinado año, de manera tal que se incluya a los niños que, al momento de la encuesta, tuvieran entre 24 y 33 meses de edad.

Vacunas a evaluar

Para el relevamiento de las vacunas aplicadas, se consideraron 5 posibles combinaciones, dado que el Calendario Nacional de Vacunación había verificado algunos cambios, incluso incorporación de nuevas vacunas. Las combinaciones contempladas, a fin de considerar a un niño con vacunación completa para la edad, se detallan en el ANEXO.

Determinación del tamaño muestral

En la determinación del tamaño de la muestra, se establece una solución de compromiso entre la precisión deseada y los costos. Lo óptimo sería plantear la precisión con la que se desea obtener los resultados y calcular el tamaño muestral a partir de ella. En la práctica, los recursos humanos y materiales disponibles son limitados, por lo tanto generalmente se elige determinar la precisión posible a partir de ellos.

El tamaño muestral establecido por el PAI se justifica a partir de la determinación clásica. El estado de vacunación del individuo se plantea como una variable binomial, lo que significa que para la totalidad de vacunas incluidas en el calendario oficial, todos los individuos son clasificados según dos categorías: vacunado / no vacunado. Para variables binomiales, el tamaño de una muestra aleatoria simple al azar requerida para producir una determinada precisión, puede determinarse según la siguiente ecuación :

imagen1_75porc   Ecuación (1)

 

 donde:
   d es la precisión deseada o tolerada para el resultado,
   z1-α/2 es un valor tabulado de la distribución Normal estándar2 ,
   p es la proporción de individuos vacunados en la población,
   q es la proporción de individuos no vacunados en la población.

La expresión anterior está relacionada con el error del estimador S(p)3 mediante:

i_met_2.png   Ecuación (2)

de donde surge que:

i_met_3.png   Ecuación (3)

El valor de p se plantea a partir de información de estudios previos o indagatoria a expertos en el tema. En caso de no ser posible disponer de esta información, se utiliza una cobertura de vacunación del 50% (p=0,50) para maximizar el tamaño muestral n.
El PAI sugiere estimar la cobertura de vacunación asignando p=0,50 debido a que no se cuenta con información sobre este valor; d=0,104 ; y z1-α/2=1,96 , ya que se desea trabajar con un nivel de confianza del (1 - α)% = 95%.

Reemplazando estos valores sugeridos en Ecuación (1) del tamaño muestral, se obtiene:

i_met_4.png

En consecuencia, deberían seleccionarse n1 = 96 individuos para la muestra, si se llavara adelante un muestreo simple al azar. Con el propósito de optimizar los recursos, el PAI propone utilizar un muestreo por conglomerados, bajo la hipótesis de que los individuos dentro de un conglomerado generalmente comparten una tendencia sobre ciertas características, a pesar de que esto implicaría una reducción en la precisión de los resultados muestrales.

Para mantener la misma precisión alcanzada con el muestreo simple al azar, se determina el tamaño muestral para el método por conglomerados (n2) y el número mínimo de conglomerados (c) a seleccionar. Se parte de la siguiente relación:

i_met_5.png   Ecuación (4)

 donde:
   b es el número medio de individuos por conglomerado en la muestra,
  coef_interclase.pnges el coeficiente de correlación intraclase.

El valor de b puede obtenerse considerando el número de hogares que los entrevistadores pueden visitar en cada conglomerado en un día completo de trabajo. El tamaño muestral del conglomerado resulta inapropiado si el equipo de entrevistadores emplea parte del día en diferentes lugares.
El coeficiente de correlación intraclase (coef_interclase.png), es una medida de la variabilidad entre los conglomerados, en comparación con la variación dentro de los conglomerados. Según algunos autores (9), en cuestiones referidas a la práctica de cuidados y servicios de salud, este coeficiente varía de 0,10 a 0,30. Este valor depende del nivel de los servicios y costumbres locales y puede variar de un país a otro, de una encuesta a otra y de un ítem a otro. Este coeficiente será mayor para aquellos ítems donde sus valores varían más entre conglomerados. En teoría puede tomar valores mayores a 1,0; pero en la práctica, rara vez excede el de 0,4.

La Ecuación (4) relaciona los tamaños muestrales n1 y n2 a través de la igualdad deseada, ya que se requiere la misma precisión en la estimación de la proporción p en ambos diseños5. El término [1+(b-1)coef_interclase.png] se denomina efecto de diseño (D). Al multiplicarlo por el tamaño muestral del diseño simple al azar (n1), se obtiene el tamaño muestral del diseño por conglomerados (n2) necesario para conservar la misma precisión. Este valor aumenta a medida que lo hace el tamaño muestral y por lo tanto, de un estudio a otro, mientras coef_interclase.png se mantiene casi constante.
La selección apropiada de los valores de bcoef_interclase.png es el punto más importante para la implementación de la encuesta, ya que permite el cálculo del efecto de diseño (D) utilizando la Ecuación (4).
Se considera b =7 (valor que el PAI utiliza, determinando un tamaño muestral que conduce a estimaciones evaluadas como eficientes) y coef_interclase.png = 0,20 en la Ecuación (4), obteniendo  el valor de n2 :

i_met_6.png

El número de conglomerados a seleccionar se obtiene con:

i_met_7.png  Ecuación (5)

En este caso:

i_met_8.png

Algunos autores, como Henderson y Lemeshow (12) (13), sugieren aumentar el tamaño muestral del muestreo simple al azar en aproximadamente el doble, siendo necesarios 192 individuos en la muestra. Si se cuenta con c =30 conglomerados, entonces en cada uno se seleccionarán al menos 7 individuos, totalizando 210 individuos. Se considera que, estadísticamente, 30 conglomerados es un número suficientemente grande como para asegurar que la media por conglomerado tienda a una distribución Normal6.

Construcción del marco muestral

 

El marco muestral para la primera etapa de muestreo consiste en un listado completo de los conglomerados con información auxiliar para cada uno (Mi) y de mapas del área elegida con sus límites geográficos y el de los conglomerados. Para la segunda etapa de muestreo, debe construirse un listado de los hogares dentro de cada conglomerado seleccionado y los mapas de las áreas correspondientes.

Las fuentes para la construcción de los marcos muestrales, dentro de cada etapa del muestreo, son provistas a nivel provincial por el Instituto Provincial de Estadísticas y Censos (IPEC);  y a nivel local, por la Secretaría de Planeamiento y la de Servicios Públicos y Medio Ambiente, así como también por la Dirección General de Estadística, dependiente de la Secretaría General de la Municipalidad de Rosario.

Método de selección

En primera instancia, se selecciona la muestra de 30 conglomerados con probabilidad proporcional a su tamaño (PPT), en cada uno de los que se seleccionan aleatoriamente los hogares de partida. La selección de conglomerados, con la misma cantidad de individuos con igual probabilidad de ser incluidos en la muestra, posibilita plantear fórmulas más sencillas al momento de analizar los datos.

Las etapas de selección se sintetizan en:
a. Elección del área ( o áreas) geográfica de estudio.
b. Establecimiento del grupo (o grupos) de edad en estudio.
c. Delimitación de los conglomerados.
d. Selección de 30 conglomerados en cada una de las áreas de estudio.
e. Selección aleatoria de un hogar en cada conglomerado: “hogar de partida”.
 

a. Elección de las áreas geográficas

La selección del área geográfica de estudio se realiza teniendo en cuenta el objetivo de la evaluación, disponibilidad de recursos humanos y materiales. Se puede estimar la cobertura de vacunación tanto para un área determinada como para un país, provincia, cuidad o pueblo. Pueden existir diferentes motivos que justifiquen la elección de un área (o áreas), como por ejemplo el caso de zonas donde se considera que la población ha sido menos alcanzada por las actividades de vacunación, o áreas con una baja notificación de dosis administradas.

b. Establecimiento de los grupos de edad

El grupo de edad en estudio se establece teniendo en cuenta las vacunas a evaluar, la edad en que se aplican las principales vacunas, la distribución de la población por edad y los costos de selección de determinado grupo etáreo. La unidad de análisis es el individuo perteneciente al grupo de edad en estudio.

c. Delimitación de los conglomerados

Los conglomerados se conforman tomando en consideración subdivisiones existentes del territorio en microáreas y la disponibilidad de datos de cada una de ellas.
Una vez evaluadas las posibilidades existentes, se selecciona aquella subdivisión en conglomerados del área que sea más conveniente, de manera que sea posible:
1. la selección de 30 conglomerados; lo cual implica que el número de subdivisiones del área en microáreas debe ser mayor o igual a 30.
2. disponer de al menos una variable con información respecto al tamaño del conglomerado (Mi). Por ejemplo, número total de viviendas; número total de hogares7; número total de niños en el grupo de edad en estudio u otro que permita valorar el tamaño del conglomerado y que se encuentre relacionado con los objetivos del estudio.
3. que el tamaño de cada conglomerado en el área de estudio sea lo suficientemente grande como para garantizar la localización de al menos 7 niños del grupo de edad en estudio.

d. Selección de los 30 conglomerados

Se procede a listar y enumerar los conglomerados, obteniendo un total de N conglomerados. Luego se determina el tamaño aproximado de cada uno de ellos (Mi) de acuerdo a la información disponible y a la que más se ajusta a la problemática en estudio.
A continuación se seleccionan c =30 conglomerados con PPT, mediante un muestreo sistemático de la siguiente forma:
♦ A partir del listado de conglomerados y utilizando los Mi, se calcula la cantidad de elementos acumulados hasta el i-ésimo conglomerado (Ni).
♦ Se divide la cantidad total de elementos en el área de estudio (M) por 30, para obtener el intervalo muestral k = M/30.
♦ Se selecciona un número aleatorio8 entre 1 y k, denominado arranque aleatorio r.
♦ El primer conglomerado en la muestra es aquel que contiene al r-ésimo elemento. Así, si r en el listado acumulado está entre Ni y Ni+1, se selecciona el conglomerado i.
♦ Se suma al arranque aleatorio r, el intervalo muestral, o sea r + k; si este valor está entre Ni y Ni+1, se selecciona el conglomerado i + 1.
De esta manera, los números de selección para los 30 conglomerados son: r, (r + k), (r + 2k), y así sucesivamente, hasta llegar a (r + (30-1)k).

e. Selección aleatoria del "hogar de partida"


Se listan y enumeran las unidades en cada uno de los conglomerados muestreados. A tales fines, el listado estará en función de la disponibilidad del territorio, por ejemplo, listado de hogares, viviendas, población, niños en edad requerida por el estudio, etc. A continuación, se selecciona un número aleatorio que representa el primer hogar a visitar y a éste se lo denomina “hogar de partida”.

Estimadores

A fin de evaluar la cobertura de vacunación se definen las siguientes variables:
yij: estado de vacunación del j-ésimo individuo en el i-ésimo conglomerado. Esta variable toma el valor 1 si el individuo tiene vacunación completa para la edad ("vacunado") y el valor 0 en caso de no tener completa la vacunación ("no vacunado").
yi+: número total de individuos examinados con carnet de vacunas completo para la edad en el i-ésimo conglomerado (i = 1, 2,.....30).
c: número de conglomerados en la muestra (c=30).
xi: número de individuos examinados en el i-ésimo conglomerado (i = 1, 2,..., 30).

Se define la proporción estimada de individuos con vacunación completa en el i-ésimo conglomerado como:


                                                                    i_met_11.png        Ecuación (6)
                              

El estimador de la proporción de individuos con vacunación completa en el área de estudio es:

i_met_12.png                                              Ecuación (7)

Generalmente, la manera de cuantificar la precisión de un estimador es a través de su error estándar (Ecuación (2)), en este caso:

i_met_13.png   Ecuación (8)

En algunos casos los valores de xi no varían demasiado de un conglomerado a otro, por lo tanto la ecuación se simplifica:

i_met_14.png   Ecuación (9)

Finalmente se construye el intervalo de confianza para el verdadero valor de la proporción de individuos con vacunación completa en el área de estudio (p), suponiendo un nivel de confianza del 95% y que su distribución es aproximadamente Normal:

Límite inferior: Li= p - 1,96. s(p)

Límite superior: Ls= p + 1,96. s(p)

A continuación, se plantean los estimadores del efecto de diseño D y del coeficiente de correlación intraclase coef_interclase.png. Estos cálculos se realizan una vez finalizada la encuesta con el objetivo de que se encuentren disponibles para futuros estudios.

El estimador del efecto de diseño es:   

i_met_15.png  Ecuación (10)

donde:
    s22.png es la variancia estimada de la proporción estimada de individuos con vacunación completa en el área, obtenida a partir de una muestra por conglomerados,
    s12.png es la variancia estimada de la proporción estimada de individuos con vacunación completa en el área, obtenida de una muestra aleatoria simple del mismo número de unidades (n1 = n2).

A partir de su definición, el efecto de diseño será próximo al valor 1 si la precisión resultante de una muestra por conglomerados es equivalente a la de un muestreo aleatorio simple. Valores de D menores a 1 ocurren con muy poca frecuencia indicando homogeneidad entre los conglomerados.
El estimador del coeficiente de correlación intraclase (o tasa de homogeneidad) es:

 i_met_16.png   Ecuación (11)

donde:
    D es el estimador del efecto de diseño obtenido en Ecuación (10),
    b es número medio de individuos por conglomerado en la muestra.

Cálculo de tamaño muestral para futuros trabajos 


A partir de los resultados obtenidos, se estima la proporción de niños con vacunación completa. Este valor junto con el efecto de diseño, puede ser utilizado en el cálculo del tamaño muestral para futuros estudios. El tamaño muestral del muestreo simple al azar (n1´) para futuras implementaciones de la encuesta es:

i_met_17.png   Ecuación (12)

donde:
    d es la precisión deseada o tolerada para el resultado utilizada en la encuesta,
    z1-α/2 es un valor tabulado de la distribución Normal,
    p es el valor estimado a partir de la encuesta realizada de individuos avcunados en la población.

El tamaño muestral para el método por conglomerados (n2´) para una implementación futura resulta:
                                                                    i_met_18.png   Ecuación (13)

Para conocer el número medio de niños a seleccionar, por conglomerado, se lo despeja de la expresión del efecto de diseño, siendo conocidos D y coef_interclase.png:

i_met_19.png                   Ecuación (14)

resulta:

i_met_20.png              Ecuación (15)

 donde:
    b´ es el número medio de individuos a seleccionar, por conglomerado, en la muestra,
  coef_interclase.png  es el coeficiente de correlación intraclase utilizado en la encuesta.

Se obtiene finalmente el número de conglomerados a seleccionar en el futuro mediante la fórmula:

i_met_21.png                                      Ecuación (16)

En resumen, de llevarse adelante en el futuro la Encuesta 30 x 7 en la misma área geográfica, con igual precisión, mismo efecto de diseño y coeficiente de correlación intraclase, se sugiere seleccionar b´ individuos en cada uno de los conglomerados, contando con una muestra de n2´ niños con la edad requerida.

 _________________________________________________________________________________________________________________________________

Notas al pie:

2 Es un valor de la abscisa en la distribución Normal, que deja a su derecha un área igual a α/2.El nivel de confianza en este caso es (1-α)=95%, por lo tanto, α = 5% entonces el valor tabulado que acumula un 0,025% en la distribución Normal es z1-α/2= 1,96.

3 El error del estimador se define como sp3.png.

4 Adoptando este valor, el estimador estará a una distancia de ±10% de la media poblacional. Por lo tanto, para una estimación del 30%, este valor de la precisión estaría indicando que el resultado real de cobertura se encuentra entre el 20% y 40%.

5 S1(p) y S2(p) es la variación del estimador a partir de una muestra aleatoria simple y una muestra por conglomerados respectivamente:
s2=s2.png

6 Resultado que surge del Teorema Central del Límite el cual establece que si de una población que posee esperanza y variancia finita se extraen muestras de tamaño n (mayor a 25), la distribución de esas medias tenderá a una distribución normal.

7 Al definirse la “Unidad Básica de Información” (Basic Sampling Unit: BSU) en este tipo de encuestas se elige la vivienda, en el sentido de hogar (household), interpretado como grupo de personas convivientes cuya comida es preparada por la misma persona, tal como es referido en “A simplified general method for cluster-sample surveys of health in developing countries” (Bennett, Woods, Liyanage, Smith)

8 La selección del número aleatorio se puede realizar de diversas maneras; en este caso, mediante el software Excel.
 

ANEXO

 

CASO 1: ESQUEMA CON CUADRUPLE

1.png

 CASO 2: ESQUEMA CON PENTAVALENTE

2.png

CASO 3: ESQUEMA COMBINADA 1 

3.png

CASO 4: ESQUEMA COMBINADA 2

4.png

CASO 5: ESQUEMA COMBINADA 3

5.png

 

Referencias Bibliográficas

(8) Expanded Programme on Immunization. Lot Quality Assurance survey assess immunization coverage (1995) Weekly Epidemiological Record, 70 (37), pp. 261-268 .

(9) Bennett, S., Woods, T., Liyanage, W.M., Smith, D.L. (1991) A simplified general method for cluster-sample surveys of health in developing countries. World Health Statistics Quaterly, 44 (3), pp. 98-106.

(10) Henderson, R.H., Sundaresan, T. (1982) Cluster sampling to assess immunization coverage: a review of experience with a simplified sampling method. Bull WHO 60 (2) pp. 253-260.

(11) Balparda, L.R. “Estimación de la cobertura de vacunación en un distrito de la ciudad de Rosario” ( 2003). Tesina de grado, Facultad de Ciencias Económicas y Estadística, Universidad Nacional de Rosario.

(12) Lemeshow, S., Robinson, D. (1985) Surveys to measure programme coverage and impact: a review of the methodology used by the expanded programme on Immunization World Health Statistics Quaterly, 38 (1), pp. 65-75.

(13) Lemeshow, S., Taber, S. (1994) Muestreo para garantizar la calidad de los lotes: estrategias de muestreo simple y muestreo doble. Boletín Oficina Sanitaria Panamá, 117 (2), pp. 142-163.

Acciones de Documento