Muestras pequeñas
Dentro de los supuestos del MCRL se decía que “debía disponerse de una información suficientemente amplia sobre el conjunto de variables observables implicadas en el modelo”.
Como mínimo para que el modelo tenga solución se exige que el número de datos (observaciones) sea superior al número de parámetros del modelo(n>k) y para efectos operativos se necesita un mínimo de alrededor de 15 datos para tener alguna garantía en la estimación de los modelos de 3 o 4 parámetros.
En todo el proceso de desarrollo del modelo de regresión se tiene presente el tamaño de la muestra y muchas de las formulas de estimación y contraste incluyen explícitamente los gl(n-k).
La existencia de muestras pequeñas (<15) producen estimaciones que aunque son insesgadas y eficientes presentas varianzas comparativamente mayores respecto de las que se obtendrían en tamaños muestrales superiores.
Como consecuencia los intervalos de predicción resultan demasiado amplios y los contrastes de significancia estadística no son conclusivos, es decir cuando se trabaja con reducidos gl(g<10) es posible que algunos o todos los parámetros resulten no significativos sea esta o no la conclusión correcta.
Por ello modelos no significativos para un número elevado de variables van cobrando significación en las variables que se mantengan tras la eliminación de otras que permiten elevar las gl sobre un mínimo.
La única solución para muestras pequeñas es trabajar con modelos relativamente simples (con pocas variables explicativas) y con la consecuencia de errores de predicción en ocasiones no demasiado satisfactoria.