Sumário


1 Objetivo

Será apresentado as principais definições, método da quantidade pivotal e aplicação do Intervalo de Confiança (IC), à um conjunto de dados com a apresentação analítica dos mesmos.

2 Introdução

A estimação intervalar desempenha um papel central na estatística inferencial, sendo amplamente utilizada para quantificar a incerteza associada à estimativa de parâmetros populacionais. Diferentemente da estimação pontual, que fornece um único valor como melhor aproximação de um parâmetro, a estimação intervalar apresenta uma faixa de valores que, com um nível de confiança especificado, contém o verdadeiro valor do parâmetro de interesse. Essa abordagem é especialmente útil em cenários onde a variabilidade dos dados ou o tamanho limitado da amostra podem impactar a precisão das inferências.

Dentre os métodos disponíveis para construir intervalos de confiança, o método baseado na quantidade pivotal (QP) destaca-se por sua flexibilidade e robustez. A QP é uma função específica das observações da amostra e do parâmetro desconhecido, que possui uma distribuição conhecida, independente do valor do parâmetro. Essa propriedade fundamental permite utilizar a QP como base para derivar intervalos de confiança de maneira sistemática, mesmo em situações onde métodos diretos podem ser inviáveis.

O uso de QPs é particularmente poderoso, pois evita a necessidade de estimar diretamente a variância do parâmetro, reduzindo assim possíveis fontes de erro. Além disso, a construção do intervalo de confiança a partir de uma QP exige apenas o conhecimento da distribuição da função pivotal e do nível de confiança desejado, proporcionando uma abordagem intuitiva e amplamente aplicável.

Neste artigo, exploraremos o método da quantidade pivotal em profundidade, desde a definição da QP para um problema específico até sua aplicação prática. Abordaremos a derivação da distribuição da QP, sua reorganização para a construção do intervalo de confiança e, finalmente, demonstraremos o método por meio de um conjunto de dados reais, destacando a importância dessa técnica para aplicações estatísticas robustas e confiáveis.

Essa abordagem visa fornecer uma base sólida para compreender e aplicar a estimação intervalar de forma rigorosa e eficaz, sendo uma ferramenta essencial para análises em diversas áreas do conhecimento.

3 Definição de uma Quantidade Pivotal (QP) para o Problema

A quantidade pivotal (QP) é uma ferramenta fundamental na construção de intervalos de confiança. Trata-se de uma função das variáveis amostrais e do parâmetro populacional desconhecido, que possui uma distribuição conhecida e fixa, independentemente do valor do parâmetro em questão. Essa propriedade torna a QP extremamente útil na inferência estatística, pois permite vincular as informações extraídas da amostra com o comportamento probabilístico de um parâmetro populacional.

Para definir uma QP no contexto de um problema específico, seguimos os seguintes passos principais:


3.1 Passo 1: Identificar o parâmetro de interesse

Primeiramente, é necessário definir qual é o parâmetro populacional que desejamos estimar. Por exemplo:
- A média \(\mu\) de uma população;
- A variância \(\sigma^2\);
- A proporção \(p\) de uma característica em uma população.

Essa escolha depende diretamente do objetivo do estudo e do contexto em que a inferência será aplicada.


3.2 Passo 2: Selecionar um estimador adequado

Com o parâmetro de interesse definido, o próximo passo é escolher um estimador pontual que seja:
1. Consistente: Sua estimativa converge para o verdadeiro valor do parâmetro à medida que o tamanho da amostra aumenta.
2. Não viesado: Em média, o estimador produz o valor correto do parâmetro.
3. Eficiente: O estimador apresenta variância mínima entre todos os estimadores não viesados.

Por exemplo, para a média \(\mu\), o estimador \(\bar{X}\), a média amostral, é amplamente utilizado por suas propriedades desejáveis.


3.3 Passo 3: Determinar uma função que combine amostra e parâmetro

A quantidade pivotal é construída como uma função das variáveis amostrais \(X_1, X_2, \dots, X_n\) e do parâmetro de interesse. Essa função é desenvolvida de forma que a distribuição resultante seja conhecida. A construção pode variar de acordo com o tipo de dado e a distribuição subjacente da variável.

Por exemplo:
- Quando \(X_i\) segue uma distribuição normal \(N(\mu, \sigma^2)\), uma quantidade pivotal para \(\mu\) é:
\[ Z = \frac{\bar{X} - \mu}{\sigma / \sqrt{n}}, \]
onde \(Z\) segue a distribuição \(N(0, 1)\), ou seja, uma normal padrão.

  • Se a variância \(\sigma^2\) é desconhecida, outra QP pode ser definida utilizando a estatística \(t\):
    \[ T = \frac{\bar{X} - \mu}{S / \sqrt{n}}, \]
    onde \(S\) é o desvio padrão amostral, e \(T\) segue a distribuição \(t\) de Student com \(n - 1\) graus de liberdade.

3.4 Passo 4: Validar a distribuição da QP

Uma vez definida a QP, sua distribuição deve ser conhecida e validada. É essencial garantir que a função pivotal seja independente do parâmetro desconhecido. Esse é o elemento-chave que assegura que a construção do intervalo de confiança seja possível.


3.4.1 Exemplo: Construção de uma QP para a média de uma população normal

  1. Parâmetro de interesse: \(\mu\);
  2. Estimador pontual: \(\bar{X}\), a média amostral;
  3. Quantidade pivotal:
    \[ T = \frac{\bar{X} - \mu}{S / \sqrt{n}}, \]
    onde \(S\) é o desvio padrão da amostra.

Distribuição da QP: \(T \sim t_{n-1}\), uma distribuição \(t\) de Student com \(n-1\) graus de liberdade.

Essa QP pode ser utilizada diretamente para construir intervalos de confiança para \(\mu\), mesmo quando \(\sigma^2\) é desconhecida.


No contexto geral, a escolha da quantidade pivotal depende diretamente do problema estatístico em análise, da distribuição dos dados, e do tipo de inferência desejada.

4 Apresentação da Distribuição da Quantidade Pivotal (QP)

A definição de uma quantidade pivotal (QP) é apenas o ponto de partida para sua utilização na estimação intervalar. O próximo passo fundamental é compreender a distribuição da QP. Esse entendimento permite determinar os valores críticos associados ao nível de confiança escolhido e, assim, construir o intervalo de confiança para o parâmetro de interesse.


4.1 O que é a Distribuição da QP?

A distribuição da QP refere-se ao comportamento probabilístico dessa função pivotal. Como mencionado anteriormente, a QP é construída de forma que sua distribuição seja:

  1. Conhecida: A distribuição deve ser derivada ou identificada com base no modelo estatístico dos dados.

  2. Independente do parâmetro desconhecido: Isso garante que a QP possa ser usada diretamente para fazer inferências sobre o parâmetro.

Por exemplo:
- Se a QP for baseada na média amostral \(\bar{X}\) de uma variável normal \(N(\mu, \sigma^2)\), sua distribuição será normal padrão \(N(0, 1)\) quando o desvio padrão populacional \(\sigma\) é conhecido.
- Quando \(\sigma\) é desconhecido, e o desvio padrão amostral \(S\) é utilizado, a QP segue uma distribuição \(t\) de Student com \(n-1\) graus de liberdade.


4.2 Derivando a Distribuição da QP em Exemplos Comuns

  1. Distribuição da QP para a Média (com \(\sigma\) conhecido):
    Para \(X_i \sim N(\mu, \sigma^2)\), a quantidade pivotal é:
    \[ Z = \frac{\bar{X} - \mu}{\sigma / \sqrt{n}}. \]
    A QP \(Z\) segue uma distribuição normal padrão \(N(0, 1)\). Essa propriedade decorre da normalidade de \(\bar{X}\) e da escala imposta pelo denominador.

  2. Distribuição da QP para a Média (com \(\sigma\) desconhecido):
    Quando o desvio padrão populacional \(\sigma\) é desconhecido, usamos o desvio padrão amostral \(S\) para definir:
    \[ T = \frac{\bar{X} - \mu}{S / \sqrt{n}}, \]
    onde \(S^2 = \frac{1}{n-1}\sum_{i=1}^n (X_i - \bar{X})^2\).
    A estatística \(T\) segue uma distribuição \(t\) de Student com \(n-1\) graus de liberdade, que é mais “larga” do que a normal padrão devido à variabilidade adicional introduzida pela estimativa de \(S\).

  3. Distribuição da QP para a Variância:
    Suponha que queremos construir um intervalo de confiança para a variância \(\sigma^2\) de uma população normal \(N(\mu, \sigma^2)\). A quantidade pivotal pode ser definida como:
    \[ \chi^2 = \frac{(n-1)S^2}{\sigma^2}, \]
    onde \(S^2\) é a variância amostral.
    Essa QP segue uma distribuição qui-quadrado (\(\chi^2\)) com \(n-1\) graus de liberdade.


4.3 Importância da Distribuição da QP

A compreensão da distribuição da QP é essencial por várias razões:

  1. Cálculo de valores críticos: Os valores críticos da distribuição, determinados a partir do nível de confiança desejado, são usados para estabelecer os limites inferior e superior do intervalo de confiança.

    • Por exemplo, para um nível de confiança de \(95\%\), usamos os quantis \(z_{0.025}\) e \(z_{0.975}\) na distribuição normal padrão.
    • Para a distribuição \(t\), usamos os valores críticos \(t_{0.025, n-1}\) e \(t_{0.975, n-1}\).
  2. Adaptação a diferentes contextos: A escolha da QP e sua distribuição são ajustadas ao problema específico, permitindo que a abordagem seja flexível e aplicável em uma ampla gama de cenários.

  3. Garantia de robustez: A independência do parâmetro desconhecido assegura que as inferências realizadas não sejam enviesadas ou inconsistentes.


4.4 Exemplo Prático

Considere uma amostra de \(n = 10\) observações extraídas de uma população normal. Queremos estimar a média \(\mu\), mas o desvio padrão populacional \(\sigma\) é desconhecido. A quantidade pivotal apropriada é:
\[ T = \frac{\bar{X} - \mu}{S / \sqrt{n}}, \]
e sabemos que \(T \sim t_{9}\), uma distribuição \(t\) com 9 graus de liberdade.

Se quisermos construir um intervalo de confiança com \(95\%\) de confiança, os valores críticos \(t_{0.025, 9}\) e \(t_{0.975, 9}\) podem ser encontrados nas tabelas da distribuição \(t\). Esses valores definem a amplitude do intervalo em torno da estimativa \(\bar{X}\).


A distribuição da QP é a peça-chave que conecta o modelo teórico à inferência prática. Entendê-la e utilizá-la corretamente é essencial para construir intervalos de confiança precisos e confiáveis, especialmente em situações onde as condições do problema exigem ajustes ou estimativas adicionais. Nos próximos passos, utilizaremos essa distribuição para pivotar a QP e derivar o intervalo de confiança.

5 Método da Quantidade Pivotal (QP)

O método da quantidade pivotal (QP) é uma técnica estatística usada para construir intervalos de confiança para parâmetros desconhecidos. Ele se baseia na identificação de uma função (ou estatística transformada) que dependa tanto do parâmetro de interesse quanto dos dados observados, mas cuja distribuição seja conhecida e não dependa de valores desconhecidos. Essa função é chamada de quantidade pivotal.

5.0.0.1 Definição de Quantidade Pivotal

Uma quantidade pivotal \(Q\) é definida como uma função das estatísticas amostrais e dos parâmetros populacionais que satisfaz as seguintes condições:

  1. Distribuição conhecida: A distribuição de \(Q\) deve ser conhecida e independente dos valores desconhecidos dos parâmetros populacionais.
  2. Dependência de parâmetros: A quantidade \(Q\) deve depender do parâmetro de interesse (\(P_1 - P_2\), neste caso) de tal forma que possamos isolá-lo durante o processo de pivotação.

No contexto do problema de duas proporções (\(P_1\) e \(P_2\)), podemos construir uma quantidade pivotal com base nas proporções amostrais \(\hat{P}_1 = X_1 / n_1\) e \(\hat{P}_2 = X_2 / n_2\), que são estimadores de \(P_1\) e \(P_2\), respectivamente.

5.0.0.2 Por que usar a QP no Problema de Duas Proporções?

Quando estamos interessados na diferença entre duas proporções, \((P_1 - P_2)\), o desafio é que as proporções reais (\(P_1\) e \(P_2\)) são desconhecidas. Ao mesmo tempo, as proporções amostrais (\(\hat{P}_1\) e \(\hat{P}_2\)) possuem variabilidade, especialmente para amostras pequenas. O método da quantidade pivotal nos permite contornar esse problema:

  1. Padronizamos a diferença amostral \((\hat{P}_1 - \hat{P}_2)\) para criar uma estatística cuja variância seja conhecida (aproximada).
  2. Usamos o teorema central do limite (TCL) para garantir que, para amostras grandes, a diferença \((\hat{P}_1 - \hat{P}_2)\) segue uma distribuição normal aproximadamente.

5.0.0.3 Construção da Quantidade Pivotal

A estatística pivotal \(Z\) para a diferença entre duas proporções pode ser definida como:
\[ Z = \frac{(\hat{P}_1 - \hat{P}_2) - (P_1 - P_2)}{\sqrt{\hat{V}}}, \] onde:

  • \((\hat{P}_1 - \hat{P}_2)\) é a diferença entre as proporções amostrais;
  • \((P_1 - P_2)\) é o parâmetro de interesse (a diferença real entre as proporções populacionais);
  • \(\hat{V}\) é a variância combinada das proporções amostrais, dada por: \[ \hat{V} = \frac{\hat{P}_1 (1 - \hat{P}_1)}{n_1} + \frac{\hat{P}_2 (1 - \hat{P}_2)}{n_2}. \]

5.0.0.4 Distribuição da QP

Sob as condições de:

  1. Amostras suficientemente grandes (\(n_1, n_2 \gg 30\));
  2. Proporções \(\hat{P}_1\) e \(\hat{P}_2\) que não sejam muito próximas de 0 ou 1;

a quantidade pivotal \(Z\) segue aproximadamente uma distribuição normal padrão:
\[ Z \sim \mathcal{N}(0, 1). \]

Essa normalidade permite derivar intervalos de confiança facilmente, utilizando os quantis da distribuição normal (\(z_{\alpha/2}\)).

6 Distribuição da Quantidade Pivotal (QP)

A distribuição da quantidade pivotal (QP) é o componente-chave que permite a construção de intervalos de confiança. No caso do problema de estimar a diferença entre duas proporções (\(P_1 - P_2\)), a QP é baseada na padronização da diferença amostral \((\hat{P}_1 - \hat{P}_2)\). Nesta seção, detalhamos como a distribuição da QP é derivada e suas propriedades.


6.1 Definição da QP no Problema das Duas Proporções

A quantidade pivotal para o problema é definida como:
\[ Z = \frac{(\hat{P}_1 - \hat{P}_2) - (P_1 - P_2)}{\sqrt{\hat{V}}}, \] onde:

  • \((\hat{P}_1 - \hat{P}_2)\): diferença entre as proporções amostrais;
  • \((P_1 - P_2)\): diferença verdadeira entre as proporções populacionais (parâmetro de interesse);
  • \(\hat{V}\): variância combinada das proporções amostrais, dada por:
    \[ \hat{V} = \frac{\hat{P}_1 (1 - \hat{P}_1)}{n_1} + \frac{\hat{P}_2 (1 - \hat{P}_2)}{n_2}. \]

6.2 Distribuição da Diferença entre as Proporções Amostrais

Para amostras independentes e suficientemente grandes, a diferença entre as proporções amostrais (\(\hat{P}_1 - \hat{P}_2\)) é aproximadamente normal. Isso decorre do Teorema Central do Limite (TCL), que afirma que a soma (ou diferença) de variáveis independentes, cada uma com distribuição binomial e variância finita, tende à normalidade quando o tamanho amostral aumenta.

Dado que \(\hat{P}_1\) e \(\hat{P}_2\) são proporções amostrais provenientes de amostras independentes, temos que:

\[ \hat{P}_1 \sim \mathcal{N}\left(P_1, \frac{P_1(1 - P_1)}{n_1}\right), \quad \hat{P}_2 \sim \mathcal{N}\left(P_2, \frac{P_2(1 - P_2)}{n_2}\right). \]

Assim, a diferença \((\hat{P}_1 - \hat{P}_2)\) também segue aproximadamente uma distribuição normal:
\[ (\hat{P}_1 - \hat{P}_2) \sim \mathcal{N}\left((P_1 - P_2), \frac{P_1 (1 - P_1)}{n_1} + \frac{P_2 (1 - P_2)}{n_2}\right). \]


6.3 Normalização e QP

Para transformar a diferença amostral em uma estatística padronizada com distribuição conhecida, dividimos a diferença \((\hat{P}_1 - \hat{P}_2)\) pela raiz quadrada de sua variância combinada. Isso resulta na quantidade pivotal \(Z\):
\[ Z = \frac{(\hat{P}_1 - \hat{P}_2) - (P_1 - P_2)}{\sqrt{\hat{V}}}. \]

Quando substituímos \(\hat{V}\) pela sua estimativa a partir das proporções amostrais (\(\hat{P}_1\) e \(\hat{P}_2\)), temos:
\[ \hat{V} = \frac{\hat{P}_1 (1 - \hat{P}_1)}{n_1} + \frac{\hat{P}_2 (1 - \hat{P}_2)}{n_2}. \]

Como resultado, para tamanhos amostrais grandes (\(n_1, n_2 \gg 30\)) e proporções \(\hat{P}_1, \hat{P}_2\) não muito próximas de 0 ou 1, \(Z\) segue aproximadamente uma distribuição normal padrão:
\[ Z \sim \mathcal{N}(0, 1). \]


6.4 Propriedades da Distribuição da QP

  1. Média: A média de \(Z\) é 0, porque a padronização centraliza a diferença amostral na diferença real (\(P_1 - P_2\)).
  2. Variância: A variância de \(Z\) é 1, pois dividimos a diferença pela raiz quadrada de \(\hat{V}\), que representa a variabilidade combinada.
  3. Simetria: Como \(Z\) segue uma distribuição normal padrão, sua forma é simétrica em torno de 0.

6.5 Justificativa para a Aproximação Normal

A aproximação normal para \(Z\) é válida sob as seguintes condições:

  • \(n_1 \cdot \hat{P}_1 \geq 5\) e \(n_1 \cdot (1 - \hat{P}_1) \geq 5\);
  • \(n_2 \cdot \hat{P}_2 \geq 5\) e \(n_2 \cdot (1 - \hat{P}_2) \geq 5\).

Estas condições garantem que a distribuição binomial subjacente das proporções amostrais seja bem aproximada pela normal.


6.6 Uso Prático da Distribuição da QP

A distribuição normal padrão da QP é usada para calcular intervalos de confiança para \((P_1 - P_2)\). Os quantis críticos da normal padrão (\(z_{\alpha/2}\)) determinam os limites do intervalo com um nível de confiança de \(1 - \alpha\).

Por exemplo, para um nível de confiança de 95%, temos:
\[ z_{\alpha/2} = 1,96. \]

7 Pivotação da Quantidade Pivotal (QP)

A pivotação é o processo de reorganizar a quantidade pivotal (QP) para isolar o parâmetro de interesse. Neste caso, buscamos a diferença entre duas proporções populacionais (\(P_1 - P_2\)). A ideia é manipular a QP de modo que ela forneça um intervalo que contenha o parâmetro com uma probabilidade pré-definida (\(1 - \alpha\)).


7.1 Relembrando a QP

A quantidade pivotal para a diferença entre duas proporções é dada por:
\[ Z = \frac{(\hat{P}_1 - \hat{P}_2) - (P_1 - P_2)}{\sqrt{\hat{V}}}, \] onde:
- \(Z\) segue aproximadamente uma distribuição normal padrão (\(Z \sim \mathcal{N}(0, 1)\)) para grandes amostras;
- \((\hat{P}_1 - \hat{P}_2)\) é a diferença entre as proporções amostrais;
- \((P_1 - P_2)\) é o parâmetro de interesse (a diferença real entre as proporções populacionais);
- \(\hat{V}\) é a variância combinada das proporções amostrais, dada por:
\[ \hat{V} = \frac{\hat{P}_1 (1 - \hat{P}_1)}{n_1} + \frac{\hat{P}_2 (1 - \hat{P}_2)}{n_2}. \]


7.2 Pivotação da QP

Para construir um intervalo de confiança, precisamos reorganizar a expressão de \(Z\) de forma que o parâmetro de interesse \((P_1 - P_2)\) fique isolado. Partimos da fórmula da QP:
\[ Z = \frac{(\hat{P}_1 - \hat{P}_2) - (P_1 - P_2)}{\sqrt{\hat{V}}}. \]

Multiplicando ambos os lados por \(\sqrt{\hat{V}}\):
\[ Z \cdot \sqrt{\hat{V}} = (\hat{P}_1 - \hat{P}_2) - (P_1 - P_2). \]

Rearranjando para isolar \((P_1 - P_2)\):
\[ (P_1 - P_2) = (\hat{P}_1 - \hat{P}_2) - Z \cdot \sqrt{\hat{V}}. \]

Como queremos um intervalo de confiança com nível de confiança \(1 - \alpha\), utilizamos os quantis críticos da distribuição normal padrão (\(z_{\alpha/2}\)) para definir os limites:
\[ -z_{\alpha/2} \leq Z \leq z_{\alpha/2}. \]

Substituímos \(Z\) na expressão pivotada:
\[ -z_{\alpha/2} \cdot \sqrt{\hat{V}} \leq (\hat{P}_1 - \hat{P}_2) - (P_1 - P_2) \leq z_{\alpha/2} \cdot \sqrt{\hat{V}}. \]

Rearranjando novamente para isolar \((P_1 - P_2)\):
\[ (\hat{P}_1 - \hat{P}_2) - z_{\alpha/2} \cdot \sqrt{\hat{V}} \leq (P_1 - P_2) \leq (\hat{P}_1 - \hat{P}_2) + z_{\alpha/2} \cdot \sqrt{\hat{V}}. \]


7.3 Fórmula do Intervalo de Confiança

O resultado final da pivotação é o intervalo de confiança para \((P_1 - P_2)\):
\[ \text{IC} = \left[ (\hat{P}_1 - \hat{P}_2) - z_{\alpha/2} \cdot \sqrt{\hat{V}}, \, (\hat{P}_1 - \hat{P}_2) + z_{\alpha/2} \cdot \sqrt{\hat{V}} \right]. \]

Aqui:
- \((\hat{P}_1 - \hat{P}_2)\) é a estimativa pontual da diferença entre as proporções;
- \(\sqrt{\hat{V}}\) é o erro padrão da diferença entre as proporções;
- \(z_{\alpha/2}\) é o quantil crítico da distribuição normal padrão para o nível de confiança \(1 - \alpha\).


7.4 Intuição do Processo

A pivotação reflete a transformação da escala de \(Z\), onde sabemos a distribuição (\(\mathcal{N}(0, 1)\)), para a escala de \((P_1 - P_2)\), onde queremos inferir o intervalo de confiança. Essencialmente, deslocamos e escalamos os limites padronizados (\(\pm z_{\alpha/2}\)) para a escala da diferença real entre as proporções, considerando o erro padrão da estimativa.


7.5 Exemplo Numérico (Breve)

Suponha que \(\hat{P}_1 = 0,6\), \(\hat{P}_2 = 0,4\), \(n_1 = 100\), \(n_2 = 120\), e desejamos construir um IC com 95% de confiança (\(z_{\alpha/2} = 1,96\)).

  1. Calcule \(\hat{V}\):
    \[ \hat{V} = \frac{0,6 \cdot (1 - 0,6)}{100} + \frac{0,4 \cdot (1 - 0,4)}{120} = 0,0024 + 0,002 \approx 0,0044. \]

  2. Erro padrão (\(\sqrt{\hat{V}}\)):
    \[ \sqrt{\hat{V}} = \sqrt{0,0044} \approx 0,0663. \]

  3. Limites do IC:
    \[ \text{IC} = \left[ 0,2 - 1,96 \cdot 0,0663, \, 0,2 + 1,96 \cdot 0,0663 \right]. \] \[ \text{IC} = [0,07, 0,33]. \]

Com 95% de confiança, a diferença verdadeira entre as proporções populacionais (\(P_1 - P_2\)) está entre 0,07 e 0,33.


8 Apresentação do Intervalo de Confiança (IC)

Após pivotar a quantidade pivotal (QP) para isolar o parâmetro de interesse, a próxima etapa é construir e interpretar o intervalo de confiança (IC). O IC fornece uma faixa de valores plausíveis para o parâmetro populacional \((P_1 - P_2)\), com um nível de confiança pré-definido (\(1 - \alpha\)). Aqui, detalhamos o cálculo e a interpretação do IC no contexto da diferença entre duas proporções.


8.1 Fórmula Geral do IC para \((P_1 - P_2)\)

Com base na QP pivotada no item anterior, o intervalo de confiança para a diferença entre duas proporções populacionais é dado por:
\[ \text{IC} = \left[ (\hat{P}_1 - \hat{P}_2) - z_{\alpha/2} \cdot \sqrt{\hat{V}}, \, (\hat{P}_1 - \hat{P}_2) + z_{\alpha/2} \cdot \sqrt{\hat{V}} \right], \] onde:
- \((\hat{P}_1 - \hat{P}_2)\) é a diferença entre as proporções amostrais, que é a estimativa pontual de \((P_1 - P_2)\);
- \(\hat{V}\) é a variância combinada estimada das proporções amostrais:
\[ \hat{V} = \frac{\hat{P}_1 (1 - \hat{P}_1)}{n_1} + \frac{\hat{P}_2 (1 - \hat{P}_2)}{n_2}; \] - \(z_{\alpha/2}\) é o valor crítico da distribuição normal padrão para o nível de confiança desejado.


8.2 Escolha do Nível de Confiança

O valor de \(z_{\alpha/2}\) depende do nível de confiança \(1 - \alpha\). Os níveis comuns e seus respectivos valores críticos são:

  • 90% de confiança: \(z_{\alpha/2} = 1,645\);
  • 95% de confiança: \(z_{\alpha/2} = 1,96\);
  • 99% de confiança: \(z_{\alpha/2} = 2,576\).

O nível de confiança mais adequado depende do problema e do rigor necessário. Níveis mais altos de confiança aumentam o comprimento do IC, indicando maior incerteza.


8.3 Interpretação do IC

O intervalo de confiança indica que, sob repetidas amostragens, aproximadamente \(1 - \alpha\) das amostras produziriam um intervalo que contém o verdadeiro valor de \((P_1 - P_2)\).

Exemplo de interpretação para um IC de 95%:
> “Estamos 95% confiantes de que a diferença entre as proporções populacionais reais (\(P_1 - P_2\)) está dentro do intervalo calculado.”


8.4 Propriedades do IC

  1. Simetria: O IC é simétrico em torno da estimativa pontual \((\hat{P}_1 - \hat{P}_2)\).
  2. Erro padrão: O comprimento do IC depende do erro padrão \(\sqrt{\hat{V}}\). Amostras maiores reduzem \(\sqrt{\hat{V}}\), estreitando o IC.
  3. Variabilidade do IC: Valores extremos de \(\hat{P}_1\) ou \(\hat{P}_2\) (próximos de 0 ou 1) podem aumentar a variância, ampliando o IC.

8.5 Exemplo de Cálculo do IC

Considere o seguinte conjunto de dados:

  • Proporção na primeira amostra: \(\hat{P}_1 = 0,6\), \(n_1 = 100\);
  • Proporção na segunda amostra: \(\hat{P}_2 = 0,4\), \(n_2 = 120\);
  • Nível de confiança: 95% (\(z_{\alpha/2} = 1,96\)).

Passo 1: Calcular \(\hat{V}\):
\[ \hat{V} = \frac{\hat{P}_1 (1 - \hat{P}_1)}{n_1} + \frac{\hat{P}_2 (1 - \hat{P}_2)}{n_2} = \frac{0,6 \cdot 0,4}{100} + \frac{0,4 \cdot 0,6}{120}. \] \[ \hat{V} = 0,0024 + 0,002 = 0,0044. \]

Passo 2: Calcular o erro padrão:
\[ \sqrt{\hat{V}} = \sqrt{0,0044} \approx 0,0663. \]

Passo 3: Estimativa pontual:
\[ \hat{P}_1 - \hat{P}_2 = 0,6 - 0,4 = 0,2. \]

Passo 4: Calcular os limites do IC:
\[ \text{IC} = \left[ 0,2 - 1,96 \cdot 0,0663, \, 0,2 + 1,96 \cdot 0,0663 \right]. \] \[ \text{IC} = [0,2 - 0,13, \, 0,2 + 0,13] = [0,07, \, 0,33]. \]

Interpretação: Com 95% de confiança, a diferença verdadeira entre as proporções populacionais (\(P_1 - P_2\)) está entre 0,07 e 0,33.


8.6 Impacto Prático

O intervalo de confiança pode ser usado para:

  1. Avaliar hipóteses: Se o IC inclui 0, isso sugere que não há evidência estatística suficiente para afirmar que as proporções populacionais são diferentes.
  2. Planejamento de políticas: Em estudos de saúde ou marketing, o IC ajuda a decidir se uma intervenção em um grupo é significativamente mais eficaz do que em outro.

9 Aplicação do Intervalo de Confiança (IC) a um Conjunto de Dados

Para consolidar os conceitos apresentados, aplicamos o método de cálculo do intervalo de confiança (IC) para a diferença entre duas proporções (\(P_1 - P_2\)) a um conjunto de dados real ou simulado. Este item inclui os cálculos detalhados e uma análise interpretativa dos resultados.


9.1 Cenário e Dados

Considere o seguinte cenário:
- Um pesquisador deseja avaliar a eficácia de duas estratégias de marketing, \(A\) e \(B\), em atrair clientes.
- Amostras independentes de clientes foram coletadas para cada estratégia:
- \(n_1 = 150\) clientes expostos à estratégia \(A\);
- \(n_2 = 200\) clientes expostos à estratégia \(B\).
- O número de conversões (clientes que realizaram compras) foi:
- \(x_1 = 90\) para a estratégia \(A\);
- \(x_2 = 70\) para a estratégia \(B\).

Proporções amostrais:
\[ \hat{P}_1 = \frac{x_1}{n_1} = \frac{90}{150} = 0,6, \quad \hat{P}_2 = \frac{x_2}{n_2} = \frac{70}{200} = 0,35. \]


9.2 Cálculo do IC

Passo 1: Estimativa pontual da diferença (\(\hat{P}_1 - \hat{P}_2\))
\[ \hat{P}_1 - \hat{P}_2 = 0,6 - 0,35 = 0,25. \]

Passo 2: Variância combinada (\(\hat{V}\))
\[ \hat{V} = \frac{\hat{P}_1 (1 - \hat{P}_1)}{n_1} + \frac{\hat{P}_2 (1 - \hat{P}_2)}{n_2}. \] Substituímos os valores:
\[ \hat{V} = \frac{0,6 \cdot (1 - 0,6)}{150} + \frac{0,35 \cdot (1 - 0,35)}{200}. \] \[ \hat{V} = \frac{0,6 \cdot 0,4}{150} + \frac{0,35 \cdot 0,65}{200} = 0,0016 + 0,0011375 = 0,0027375. \]

Passo 3: Erro padrão (\(\sqrt{\hat{V}}\))
\[ \sqrt{\hat{V}} = \sqrt{0,0027375} \approx 0,0523. \]

Passo 4: Valor crítico (\(z_{\alpha/2}\))
Para um nível de confiança de 95%, temos \(z_{\alpha/2} = 1,96\).

Passo 5: Limites do IC
\[ \text{IC} = \left[ (\hat{P}_1 - \hat{P}_2) - z_{\alpha/2} \cdot \sqrt{\hat{V}}, \, (\hat{P}_1 - \hat{P}_2) + z_{\alpha/2} \cdot \sqrt{\hat{V}} \right]. \] Substituímos os valores:
\[ \text{IC} = \left[ 0,25 - 1,96 \cdot 0,0523, \, 0,25 + 1,96 \cdot 0,0523 \right]. \] \[ \text{IC} = \left[ 0,25 - 0,1025, \, 0,25 + 0,1025 \right] = \left[ 0,1475, \, 0,3525 \right]. \]


9.3 6.3. Interpretação dos Resultados

Com 95% de confiança, a diferença verdadeira entre as proporções de conversões nas duas estratégias (\(P_1 - P_2\)) está entre 0,15 e 0,35.

  • Como o intervalo não inclui 0, isso sugere que há evidências de que a estratégia \(A\) é mais eficaz que a estratégia \(B\) em atrair clientes.
  • A amplitude do intervalo (0,3525 - 0,1475 = 0,205) reflete a incerteza associada à estimativa, influenciada pelo tamanho da amostra e pela variabilidade das proporções.

9.4 Visualização e Comunicação

Para facilitar a comunicação dos resultados, podemos apresentar:

  1. Gráfico: Um gráfico de barras comparando as proporções amostrais (\(\hat{P}_1 = 0,6\) e \(\hat{P}_2 = 0,35\)) com as margens de erro indicadas pelo IC.
  2. Resumo descritivo:
    • Estratégia \(A\): proporção de conversão = 60% (IC: [55%, 65%]);
    • Estratégia \(B\): proporção de conversão = 35% (IC: [30%, 40%]);
    • Diferença estimada: 25% (IC: [15%, 35%]).

9.5 Conclusão

A aplicação prática confirma que a estratégia \(A\) é significativamente mais eficaz que a estratégia \(B\) dentro do nível de confiança de 95%. O uso do intervalo de confiança possibilita inferências robustas com base em dados amostrais, oferecendo suporte estatístico para decisões práticas.

10 Conclusão: Implicações e Reflexões sobre o Intervalo de Confiança

Após desenvolver os cálculos e a análise do intervalo de confiança (IC) para a diferença entre duas proporções (\(P_1 - P_2\)), o último passo é consolidar os aprendizados, refletir sobre as implicações práticas e destacar os cuidados na aplicação desse método. Esta seção explora essas ideias, alinhando-as com a teoria e a prática.


10.1 Síntese do Método

O cálculo do IC para \((P_1 - P_2)\) se baseia em:

  1. Estimativa pontual: A diferença amostral entre proporções (\(\hat{P}_1 - \hat{P}_2\)) fornece uma ideia inicial do parâmetro.
  2. Variabilidade: A variância combinada \(\hat{V}\) captura a incerteza devido ao tamanho das amostras e à variabilidade intrínseca dos dados.
  3. Distribuição normal: O uso da aproximação normal padrão (via quantidade pivotal \(Z\)) é válido para amostras suficientemente grandes.
  4. Nível de confiança: O IC reflete o grau de certeza desejado na inferência, sendo controlado por \(1 - \alpha\).

O método é poderoso porque combina simplicidade com flexibilidade, aplicando-se a problemas em áreas diversas, como saúde pública, pesquisa de mercado e ciências sociais.


10.2 Resultados e Interpretação Prática

No exemplo trabalhado (item 6), o IC calculado foi:
\[ \text{IC} = [0,1475, \, 0,3525]. \]

Implicações práticas:
- Este intervalo sugere que a estratégia \(A\) provavelmente supera a estratégia \(B\) em conversões, com uma diferença plausível entre 14,75% e 35,25%.
- A ausência de 0 no intervalo reforça a significância estatística da diferença observada.
- O intervalo também demonstra que, embora \(A\) seja mais eficaz, o grau dessa superioridade pode variar consideravelmente.


10.3 Reflexões sobre as Limitações

  1. Tamanho da amostra:
    Pequenas amostras aumentam a variância e ampliam o IC, reduzindo a precisão das inferências. No caso apresentado, \(n_1 = 150\) e \(n_2 = 200\) são moderados, mas amostras maiores poderiam estreitar o intervalo.

  2. Assunção de normalidade:
    A aproximação pela normal padrão é válida apenas quando \(n_1 \cdot \hat{P}_1\), \(n_1 \cdot (1 - \hat{P}_1)\), \(n_2 \cdot \hat{P}_2\) e \(n_2 \cdot (1 - \hat{P}_2)\) são suficientemente grandes. Caso contrário, métodos baseados em distribuições exatas (como a binomial) podem ser necessários.

  3. Viés de seleção:
    A representatividade das amostras é crucial. Se as amostras não forem independentes ou não representarem adequadamente as populações, o IC pode ser enviesado.

  4. Interpretação frequencista:
    O IC não implica que o parâmetro está contido no intervalo com uma probabilidade de 95% (essa é uma interpretação bayesiana). Em vez disso, refere-se à proporção de intervalos que conteriam o verdadeiro valor sob repetidas amostragens.


10.4 Extensões do Método

O método do IC para \((P_1 - P_2)\) pode ser ampliado para abordar outros problemas:

  • Testes de hipótese: Determinar se a diferença observada é estatisticamente significativa com base no IC.
  • Análise de equivalência: Usar ICs para avaliar se duas proporções são suficientemente próximas (ex.: na bioequivalência de medicamentos).
  • Cálculo de tamanho amostral: Utilizar a fórmula do IC para planejar estudos, garantindo precisão desejada.

10.5 Conclusão Final

O intervalo de confiança é uma ferramenta indispensável para análises estatísticas, oferecendo uma maneira intuitiva de lidar com incertezas e apoiar a tomada de decisões informadas. No contexto específico de comparar duas proporções, ele combina rigor matemático com aplicabilidade prática, desde estudos exploratórios até avaliações de impacto.