¿Cómo entender el problema del sesgo de selección de muestras?
2. Si las muestras tomadas son aleatorias, es decir, muestras obtenidas de manera similar a la "lotería", los parámetros estimados en base a estos datos de muestra pueden reflejar con precisión las características relevantes de la población, es decir. , Los parámetros estimados teóricamente son imparciales y consistentes. Además, cuanto mayor sea la muestra, más precisa será la descripción de la distribución característica general de los acontecimientos.
3. Sin embargo, si las muestras de muestreo no son aleatorias, entonces los parámetros estimados a partir de estos datos de muestra no pueden reflejar con precisión la distribución de las propiedades de la población bajo estudio, sin importar cuán grande sea el tamaño de la muestra. Pero en el estudio de diferentes eventos, la mayoría de las muestras no son aleatorias, porque la población de eventos es siempre bastante grande, o incluso ilimitada. Por lo tanto, la mayor parte del muestreo sólo puede llevarse a cabo dentro del alcance limitado y las reglas elegidas por el investigador, lo que puede provocar sesgos en la selección del muestreo, o no incluir variables relevantes en el muestreo, o incluir variables irrelevantes en el muestreo.