Amostragem dupla

Amostragem dupla

Explicamos o que é amostragem dupla, exemplos, vantagens e desvantagens e colocamos exercícios resolvidos

Na amostragem dupla, você deseja conhecer mais profundamente uma variável de uma população

O que é amostragem dupla?

Ele Amostragem dupla É uma técnica usada em estatísticas inferenciais quando você deseja saber mais detalhes e certeza sobre uma variável específica, que caracteriza uma certa população.

A segunda amostra populacional é geralmente realizada após uma primeira amostra, cuja análise não mostrou uma conclusão estatisticamente significativa em nenhuma das variáveis ​​do estudo foi tomada e analisada.

Por esse motivo, a amostragem de estatísticas duplas também é conhecida como Duas fases amostragem. A utilidade da segunda amostra está na qual ajuda a determinar com mais precisão a estimativa de razões e regressões de uma certa variável auxiliar, que surge à luz da análise de uma primeira amostra.

Outro uso que é dado à amostragem dupla é coletar informações para a realização de uma amostragem de estratos.

Exemplos

Abaixo estão várias situações em que a amostragem dupla é justificada.

Controle de qualidade na elaboração de peças

O método de amostragem dupla é frequentemente usado no controle de qualidade industrial e geralmente é feito em duas fases.

Por exemplo, suponha uma máquina industrial que prepare certas peças. Por mais que a máquina seja ajustada, nenhuma peça é idêntica a outra, pois em suas dimensões e peso pequenas variações podem ocorrer. Trata -se de determinar se muitas peças fabricadas pela referida máquina atendem aos critérios de tolerância para que seja aceita ou rejeitada.

Primeiro, uma amostra aleatória de peças é tomada com a qual uma das variáveis ​​deve ser verificada, por exemplo, o comprimento da peça, está dentro da tolerância.

No caso de o comprimento médio estar abaixo ou acima do grau de tolerância desejado para a referida variável, nesta primeira amostra, é inferido que o lote está com defeito e deve ser descartado. Nesse caso, não é necessário pegar novas amostras.

Pode servir a você: coeficiente de correlação: fórmulas, cálculo, interpretação, exemplo

Pelo contrário, se o valor médio estiver dentro da faixa de tolerância, mas o desvio padrão da amostra for grande o suficiente para a soma ou subtração para o valor médio está fora da margem, será necessário reunir uma segunda amostra importante.

Esta segunda amostra deve incluir a amostra original para refazer os cálculos e, portanto, poder tomar uma decisão final sobre a variável investigada. Dessa forma, pode -se saber se o lote está com defeito ou não.

Diminuição dos custos de amostragem

Em muitas ocasiões, é difícil acessar informações sobre uma das variáveis ​​que você deseja estudar. Mas pode haver uma variável auxiliar mais facilmente para a coleta de dados.

Nesse caso, duas amostras são coletadas, uma grande para a variável auxiliar, mais barata e uma amostra menor, contida na amostra principal da variável mais cara.

Este método é aplicável sempre que é determinado que há uma correlação entre as duas variáveis, o que geralmente é uma relação de proporcionalidade.

Um exemplo dessa situação aparece nas ciências florestais, onde se deseja determinar a porcentagem de árvores afetadas por uma planta de parasita (La Tiña).

Como são regiões muito extensas e difíceis de acessar, a população completa de árvores é inviável no tempo e nos custos. Essas etapas são seguidas:

Etapa 1: Amostragem

A amostragem preliminar consistiria no uso da fotografia aérea e a floresta é subdividida em lotes. Alguns lotes são escolhidos aleatoriamente e estimados, pela análise das imagens dos lotes escolhidos, quantas árvores são afetadas pela micose, uma vez que a cor das árvores é afetada pelo parasita.

Pode atendê -lo: Teorema da Euclid

Etapa 2: Trabalho de campo

Mas a análise fotográfica não pode ser precisa, por isso passamos a escolher, de preferência aleatoriamente, alguns muitos da primeira amostra a fazer um trabalho de campo.

Etapa 3: Comparação

Então o resultado do campo é comparado com o fotográfico para a interceptação dos dois lotes. Essa comparação pode ser realizada, por exemplo, fazendo um gráfico no qual o eixo horizontal é o valor obtido para cada lote por fotografia e no eixo vertical o valor obtido pelo lote através do trabalho de campo.

Este método gráfico permite identificar visualmente se há ou não uma correlação entre os dois resultados e determinada, através de uma análise de regressão, a proporcionalidade ou coeficiente de proporção entre as duas amostras.

Após a amostra principal, ou seja, a amostra fotográfica, o valor médio das árvores infectadas e seu desvio padrão é tomado. Mas como o coeficiente de proporcionalidade e seu erro com as amostras de campo foram determinados, é possível corrigir o resultado da amostra principal (o fotográfico).

Então esse resultado pode ser extrapolado para a população completa de árvores.

Vantagens e desvantagens da amostragem dupla

Nos exemplos descritos, a vantagem de custo é evidência.

Uma desvantagem é que, no caso de amostragem dupla para controle de qualidade, existe o risco de passar por bons produtos que estão sem tolerância.

Exercício

Você quer estimar o número de árvores doentes em uma floresta de 162 hectares. Como a floresta é muito extensa, ela é subdividida em 100 parcelas da mesma área. 18 parcelas são escolhidas aleatoriamente e, através de um estudo fotográfico, estima -se que nessas 18 parcelas existem 8 árvores doentes com um erro padrão de cerca de 4,5 árvores.

Pode atendê -lo: quais são as partes da fração? (Exemplos)

Destas 18 parcelas, 8 parcelas são escolhidas aleatoriamente. Para essas oito parcelas, o estudo fotográfico resulta em 10 árvores doentes com um erro de mais ou menos 5,3 árvores.

Por outro lado, para as mesmas oito parcelas, o estudo de campo joga 12,4 árvores doentes com um erro de mais de 6,3 árvores.

É solicitado:

  • a) Determine o coeficiente de proporcionalidade entre o estudo de campo por regressão linear.
  • b) Estime o número de árvores doentes através do método fotográfico nas cem parcelas.
  • c) Aplique a correção com o coeficiente de proporcionalidade obtido, para estimar o número real de árvores doentes em toda a floresta.

Solução

Um gráfico do número de árvores por contagem fotográfica versus contagem de campos para os oito lotes selecionados para ambos os estudos.

Contagem fotográfica versus contagem de campo. Fonte: f. Zapata.

Uma linha de tendência é ajustada e sua inclinação é determinada. Nesse caso, obtém -se que o coeficiente de proporcionalidade é 1,23. Ou seja, se x for o número da contagem fotográfica, estima -se que a contagem de campo seja y = 1,23 x.

O número de árvores doentes de acordo com a contagem fotográfica nos 18 lotes selecionados será:

18 x 8,5 = 153

Mas como toda a floresta foi dividida em 100 parcelas da mesma área, o número de árvores doentes estimadas pelo método fotográfico é: (100/18) x 153 = 850.

O fator de correção obtido da comparação entre o campo e o estudo fotográfico agora é aplicado:

Número real estimado de árvores doentes na floresta = 1,23 x 850 = 1046.

Referências

  1. Amostra dupla para estimativa de proporção, PennState College. Recuperado da PSU.Edu
  2. Amostragem dupla, múltipla e segental, NC State University. Recuperado do NCSU.Edu
  3. Amostragem aleatória simples. Recuperado da investimento.com
  4. O que é amostragem dupla? Recuperado de: nist.Gov
  5. Amostra. Recuperado de: em.Wikipedia.org
  6. Amostra de vários estágios. Recuperado de: em.Wikipedia.org