Neste relatório iremos falar sobre o Teoremo do Limite Central (TLC), no qual afirma que, dada uma amostra suficientemente grande de variáveis aleatórias independentes e identicamente distribuídas (iid), a soma ou a média dessas variáveis tende a seguir uma distribuição normal, independentemente da distribuição original das variáveis. Isso significa que, mesmo que os dados individuais não sigam uma distribuição normal, a distribuição das médias amostrais de dados tende a ser aproximadamente normal, desde que o tamanho da amostra seja grande o suficiente.
Vamos explorar exemplos específicos do Teorema do Limite Central (TLC) com gráficos e explicações de cada cenário. Cada exemplo se refere a diferentes tipos de dados ou situações que ilustram o funcionamento do TLC.
A variável \(Z_n\) é dada por:
\[ Z_n = \frac{\bar{X} - \mu}{\sigma/\sqrt{n}} \overset{n \to \infty}{\longrightarrow} N(0, 1) \]
onde \(\bar{X} = \frac{1}{n} \sum_{i=1}^{n} X_i\), com \(X_i \sim (\mu, \sigma^2)\), sendo independentes e identicamente distribuídos. A esperança de \(\bar{X}\) é igual à média populacional \(\mu\), e sua variância é \(\frac{\sigma^2}{n}\).
Podemos calcular a esperança de \(Z_n\):
\[ E(Z_n) = 0 \]
E a variância de \(Z_n\):
\[ \text{Var}(Z_n) = 1 \]
Logo, \(Z_n\) é uma variável distribuída normalmente com média zero e variância 1.
A função característica \(\varphi_X(t)\) de uma variável aleatória \(X\) é:
\[ \varphi_X(t) = E[e^{itX}] \]
Ela é única e sempre existe, sendo relacionada aos momentos de \(X\). A função característica de uma soma de variáveis independentes é o produto das funções características de cada variável. Para variáveis independentes \(X_1, X_2, ..., X_n\), temos:
\[ \varphi_{a_1X_1 + a_2X_2 + ... + a_nX_n}(t) = \prod_{i=1}^{n} \varphi_{X_i}(a_i t) \]
Expansão da função característica usando a série de Taylor:
\[ \varphi_Y(t/\sqrt{n}) = 1 - \frac{t^2}{2n} + o(t^2) \]
Quando \(n \to \infty\), obtemos:
\[ \lim_{n \to \infty} \varphi_{Z_n}(t) = e^{-\frac{t^2}{2}} \]
Essa é a função característica de uma variável normal \(N(0, 1)\).
Assim, conforme \(n \to \infinito\), a distribuição da média amostral tende a uma distribuição normal, com a mesma média da população.
Imagine que você esteja lançando uma moeda honesta (justa) várias vezes e contando quantas “caras” você obteve. A variável “cara” segue uma distribuição binomial, pois temos dois resultados possíveis (cara ou coroa) e podemos calcular a média dos resultados obtidos em várias amostras.
Situação:
Explicação Gráfica: 1. A distribuição original dos lançamentos de uma moeda tem dois resultados possíveis: 0 (coroa) e 1 (cara). 2. Ao calcular a média de várias amostras, a distribuição dessas médias se aproxima de uma distribuição normal conforme \(n\) aumenta.
Nos gráficos acima, temos a demonstração do Teorema do Limite Central aplicada ao lançamento de uma moeda (distribuição binomial). Abaixo, explico cada gráfico:
2.Médias Amostrais:
O Teorema do Limite Central (TLC) é um conceito fundamental na estatística que afirma que, à medida que o tamanho da amostra aumenta, a distribuição das médias amostrais de variáveis aleatórias independentes e identicamente distribuídas (iid) se aproxima de uma distribuição normal, independentemente da distribuição original dessas variáveis.
Imagine que você esteja lançando uma moeda justa (probabilidade de 50% para cara e 50% para coroa). Esse processo segue uma distribuição binomial, onde os únicos resultados possíveis são “cara” ou “coroa”. Se você lançar a moeda várias vezes e calcular a proporção de caras para diferentes tamanhos de amostra, a distribuição dessas proporções se aproximará de uma distribuição normal, conforme o número de lançamentos aumenta.
Com pequenas amostras (n = 2 ou 3): A proporção de “caras” pode variar muito. No entanto, ao calcular médias para mais lançamentos (por exemplo, \(n = 100\)), essa média tende a se estabilizar perto de 0.5 (que é a média esperada para uma moeda justa).
Aplicação: Essa ideia é usada em testes de hipóteses sobre proporções, como em pesquisas de opinião pública.
Estudando o comprimento dos peixes em um lago, e essa característica segue uma distribuição assimétrica, com muitos peixes pequenos e poucos peixes grandes. Ao coletar pequenas amostras (por exemplo, 5 peixes por vez), as médias amostrais podem variar consideravelmente. No entanto, à medida que o tamanho das amostras aumenta (por exemplo, 50 ou 100 peixes por vez), as médias dessas amostras se aproximam de uma distribuição normal, mesmo que a distribuição dos comprimentos individuais não seja normal.
Em uma sala de aula, imagine que os resultados de uma prova sigam uma distribuição multimodal (alguns alunos tiram notas muito baixas, outros muito altas, e o grupo no meio tem notas medianas). Se pegarmos uma pequena amostra de alunos e calcular a média das notas, pode obter uma média que não reflete o grupo inteiro, especialmente se sua amostra incluir apenas alunos de um dos grupos extremos. No entanto, se pegarmos amostras grandes de notas e calcular a média de cada uma, as médias amostrais começam a seguir uma distribuição normal. Isso acontece porque, à medida que tomamos mais alunos na amostra, a variação individual tende a se anular, deixando uma média mais representativa.
Suponhamos que o número de pedidos recebidos por um restaurante em uma hora siga uma distribuição de Poisson (usada para modelar contagens de eventos). Esse número pode variar consideravelmente de hora para hora, mas se calcularmos a média de pedidos por hora ao longo de um dia inteiro, ou de várias semanas, essa média vai se aproximar de uma distribuição normal.
O Teorema do Limite Central é uma ferramenta poderosa que fundamenta a inferência estatística, permitindo a estimativa de parâmetros de populações inteiras pela análise de amostras suficientemente grandes.