miércoles, 10 de enero de 2024

Estimación

Es un valor específico observado de un estimador, por lo que asigna un valor numérico a un parámetro de una población sobre la base de datos de muestra.

Razón para estimar

Los administradores utilizan las estimaciones porque se deben tomar decisiones racionales, sin que tengan la información pertinente completa y con una gran incertidumbre acerca de lo que pueda deparar el futuro, pero con la esperanza de que las estimaciones posean una semejanza razonable con el resultado.

Tipos de estimación

a) Estimación puntual: consiste en un solo estadístico muestral que se usa para estimar el valor verdadero de un parámetro de una población que es desconocido. Por ejemplo, la media muestral.

X es una estimador puntual de la media poblacional μ. Cuando usamos una estimación puntual, sabemos que, aunque usemos un método bueno de estimación es prácticamente improbable que el valor de la estimación coincida con el verdadero valor del parámetro, así que sería conveniente acompañar nuestra estimación con alguna medida que nos permitiera expresar la cercanía del estimador al parámetro. 

Una solución a ello no los brinda los estimadores por Intervalos de Confianza.

b) Estimación por intervalo: es la estimación de un parámetro de la población dado por dos números entre los cuales se puede considerar que se encuentra el parámetro. Las estimaciones de intervalo indican la precisión de una estimación y son, por lo tanto, preferibles a las estimaciones puntuales.

Estimador

Es la regla o procedimiento, expresado en general por medio de una fórmula, que se utiliza para deducir la estimación.

Características de los estimadores

1) Sesgo: Se dice que un estimador es insesgado si la Media de la distribución del estimador es igual al parámetro.

Estimadores insesgados son la Media muestral (estimador de la Media de la población) y la Varianza (estimador de la Varianza de la población): 

Ejemplo:

En una población de 500 puntuaciones cuya Media (m) es igual a 5.09 han hecho un muestreo aleatorio (número de muestras= 10000, tamaño de las muestras= 100) y hallan que la Media de las Medias muestrales es igual a 5.09, (la media poblacional y la media de las medias muestrales coinciden). En cambio, la Mediana de la población es igual a 5 y la Media de las Medianas es igual a 5.1 esto es, hay diferencia ya que la Mediana es un estimador sesgado.

La Varianza es un estimador sesgado. Ejemplo: La Media de las Varianzas obtenidas con la Varianza 


En un muestreo de 1000 muestras (n=25) en que la Varianza de la población es igual a 9.56 ha resultado igual a 9.12, esto es, no coinciden. En cambio, al utilizar la Cuasi varianza

La Media de las Varianzas muestrales es igual a 9.5, esto es, coincide con la Varianza de la población ya que la Cuasi varianza es un estimador insesgado.

2) Consistencia. Un estimador es consistente si aproxima el valor del parámetro cuanto mayor es n (tamaño de la muestra).

Algunos estimadores consistentes son:


Ejemplo:

En una población de 500 puntuaciones cuya Media (m) es igual a 4.9 han hecho tres muestreos aleatorios (número de muestras= 100) con los siguientes resultados:

vemos que el muestreo en que n=100 la Media de las Medias muestrales toma el mismo valor que la Media de la población.


3) Eficiencia. Diremos que un estimador es más eficiente que otro si la Varianza de la distribución muestral del estimador es menor a la del otro estimador. Cuanto menor es la eficiencia, menor es la confianza de que el estadístico obtenido en la muestra aproxime al parámetro poblacional.

Ejemplo:

La Varianza de la distribución muestral de la Media en un muestreo aleatorio (número de muestras: 1000, n=25) ha resultado igual a 0.4. La Varianza de la distribución de Medianas ha resultado, en el mismo muestreo, igual a 1.12, (este resultado muestra que la Media es un estimador más eficiente que la Mediana).

 


 

VIDEO:







Intervalo de confianza para la proporción de una población.

     El intervalo de confianza para una proporción poblacional es un rango estimado de valores dentro del cual se espera que se encuentre la proporción real de una característica en toda una población. Proporciona una medida de la incertidumbre asociada con la estimación de una proporción basada en una muestra de la población.

     En términos más técnicos, el intervalo de confianza para una proporción poblacional se calcula utilizando la fórmula:



     Donde la estimación de la proporción muestral es la proporción calculada a partir de la muestra y el margen de error tiene en cuenta la variabilidad de la muestra y el nivel de confianza deseado.

     El nivel de confianza es una medida de qué tan seguro se desea estar en la estimación y generalmente se expresa como un porcentaje, como el 95% o el 99%. Un nivel de confianza del 95% significa que hay un 95% de probabilidad de que el intervalo de confianza captura la proporción real de la población.

     Adviértase que llegamos a un resultado en principio incongruente: queremos saber cuántas observaciones tenemos que realizar para estimar p y para ello necesitaremos conocer su estimación, valor que conoceremos una vez hayamos realizado las observaciones. ¿Cómo solucionar este problema? Existen tres posibles vías:

     a) Si tuviésemos información (encuestas anteriores, opiniones de experto,...) sobre el posible valor de la proporción a estimar, sustituiríamos este valor en la anterior expresión.

     b) Podríamos realizar una pequeña encuesta (encuesta piloto) que nos proporcionase una primera evaluación de la proporción muestral. Además, esta encuesta puede servir para probar y reformar el cuestionario, organizar el trabajo de campo, etc.

     c) Si no contásemos con información alguna ni tuviésemos la posibilidad de realizar la encuesta piloto, nos pondríamos en la situación más desfavorable, esto es, la que da lugar al tamaño muestral más grande para la fiabilidad y precisión deseadas. Esa situación se produce cuando n alcanza su máximo, lo cual ocurre cuando p=q=0.5.

VIDEO:





Intervalo de confianza para la diferencia de Medias poblaciones μ1 - μ2 . (Varianzas Poblacionales conocidas y desconocida)

     El intervalo de confianza para la diferencia de medias poblacionales μ1 - μ2 se utiliza para estimar el rango de valores que probablemente contenga la verdadera diferencia entre dos medias poblacionales con un cierto nivel de confianza.

  Si las varianzas poblacionales son conocidas, la fórmula para calcular el intervalo de confianza es:

     Donde x1​ y x2​ son las medias de las muestras 1 y 2, respectivamente, σ1​ y σ2​ son las desviaciones estándar de las poblaciones 1 y 2, respectivamente, n1​ y n2​ son los tamaños de las muestras 1 y 2, respectivamente, y z α/2​​ es el valor crítico de la distribución normal estándar para un nivel de confianza del (1−α)%.

     Si las varianzas poblacionales son desconocidas, pero se asume que son iguales, la fórmula para calcular el intervalo de confianza es:

 

     Donde s 2/p​ es la varianza agrupada, que se calcula como:

 

     Aquí, s 2/1​ y s 2/2​ son las varianzas de las muestras 1 y 2, respectivamente, y t α/2 ​n1​+n2​−2​ es el valor crítico de la distribución t de Student para un nivel de confianza del (1−α)% y (n1​+n2​−2) grados de libertad.

as:Ejemplo:

Supongamos que se quiere comparar la señal de dos tipos de antenas utilizados en la red de wi-fi de una empresa. Se toman dos muestras independientes de cada tipo de señal y se obtienen los siguientes resultados:


Muestra 1 (Antena A):

  • n1 = 40
  • X̄1 = 90
  • σ1 = 6

Muestra 2 (Antena  B): 

  • n2 = 30
  • X̄2 = 70
  • σ2 = 7
    Si las varianzas poblacionales son conocidas, se utilizar la fórmula del intervalo de confianza mencionada anteriormente.

    Si las varianzas poblacionales son desconocidas, se utiliza el método de diferencia de medias con varianzas desconocidas pero iguales.

   En este caso, se utiliza la distribución t de Student en lugar de la distribución normal.

Para calcular el intervalo de confianza para la diferencia de medias, primero debemos determinar si las varianzas poblacionales son conocidas o desconocidas.


Caso 1: Varianzas poblacionales conocidas


Intervalo de confianza =



Supongamos que deseamos un nivel de confianza del 95% (α = 0.05).


  • El valor crítico correspondiente a un nivel de confianza del 95% es Z = 1.96.


Sustituyendo los valores en la fórmula, obtenemos:



Calculando el intervalo de confianza, se obtiene:



1) 20+ 1.96 √2.53 = 23.11
2) 20-1.96√2.53 = 16.88 


Por lo tanto, el intervalo de confianza para la diferencia de medias poblacionales μ1 - μ2 es (22.11 -16.88) con un nivel de confianza del 95%.


Caso 2: Varianzas poblacionales desconocidas


Se utiliza la misma fórmula embargo, la fórmula y el enfoque general son similares al caso de varianzas conocidas, pero se utiliza la distribución t en lugar de Z.


VIDEO:





 

 


Intervalo de confianza para la Media poblaciones μ Cvarianza Poblacional conocida y varianza Poblacional desconocidas.

 El intervalo de confianza (IC) es un rango estadístico que se utiliza para estimar un parámetro desconocido de una población basado en una muestra de esa población. En el caso de la media poblacional (μ), hay dos situaciones comunes: cuando la varianza poblacional es conocida y cuando es desconocida.


Caso 1: Varianza Poblacional Conocida


Fórmula del intervalo de confianza:

 X ± Z (σ/√n) 


 X1 = representa la media muestral.


Z=  es el valor crítico z asociado al nivel de confianza deseado. 


σ=  es la desviación estándar poblacional.


√n=  es la raíz cuadrada del tamaño de la muestra.


Caso 2: Varianza Poblacional Desconocida


Fórmula del intervalo de confianza:

X ± t (s/√n)


X1=  representa la media muestral.


t= es el valor crítico, que tiene en cuenta la variabilidad adicional introducida al estimar la desviación estándar poblacional a partir de la muestra.


 s= es la desviación estándar muestral.


√n= Está presente nuevamente para ajustar el error estándar de la media.


Consideraciones:


  • Tamaño de la Muestra (n): A medida que el tamaño de la muestra aumenta, la distribución t se aproxima a la distribución normal estándar, y los intervalos de confianza se vuelven más estrechos.
  • Nivel de Confianza: Aumentar el nivel de confianza aumentará la amplitud del intervalo de confianza, ya que se deben incluir más valores en la cola de la distribución.
  • Precisión vs. Confianza: Existe un trade-off entre la precisión del intervalo (cuán estrecho es) y el nivel de confianza. Un intervalo de confianza más estrecho implica mayor precisión, pero puede ser menos seguro en términos de contener la verdadera media.

VIDEO



Estimación

Es un valor específico observado de un estimador, por lo que asigna un valor numérico a un parámetro de una población sobre la base de datos...