Teste de Mann - Whitney O que é e quando se aplica, execução, exemplo
- 3930
- 716
- Gilbert Franecki
O Teste de Mann - Whitney É aplicado para comparar duas amostras independentes quando elas têm poucos dados ou não seguem uma distribuição normal. Dessa forma, é considerado um teste não paramétrico, Ao contrário do seu colega Teste T do aluno, que é usado quando a amostra é grande o suficiente e segue a distribuição normal.
Frank Wilcoxon propõe -o pela primeira vez em 1945, para amostras de tamanhos idênticos, mas dois anos depois foi estendido no caso de amostras de tamanho diferente por Henry Mann e D. R. Whitney.
figura 1. O teste U de Mann - Whitney é aplicado para a comparação de amostras independentes. Fonte: Pixabay.Freqüentemente o teste é aplicado para verificar se há uma relação entre uma variável qualitativa e outro quantitativo.
Um exemplo ilustrativo é levar um conjunto de pessoas hipertensas e extrair dois grupos, para quem os dados diários da pressão arterial são registrados por um mês.
Para um grupo, o tratamento a e outro é aplicado o tratamento b. Aqui a pressão arterial é a variável quantitativa e o tipo de tratamento é o qualitativo.
Você quer saber se a mediana, e não a média, dos valores medidos é estatisticamente igual ou diferente, para estabelecer se há uma diferença entre os dois tratamentos. Para obter a resposta, o Wilcoxon ou U -Test of Mann - Whitney é aplicado.
[TOC]
Abordagem de problema no teste U de Mann - Whitney
Outro exemplo em que o teste pode ser aplicado é o seguinte:
Suponha que você queira saber se o consumo de refrigerantes difere significativamente em duas regiões do país.
Um deles é chamado Região A e a outra região B. É realizado um registro dos litros consumidos semanalmente em duas amostras: uma das 10 pessoas para a região A e outra de 5 pessoas para a região B.
Os dados são os seguintes:
-Região a: 16, 11, 14, 21, 18, 34, 22, 7, 12, 12
-Região b: 12,14, 11, 30, 10
A seguinte pergunta é levantada:
O consumo de refrigerantes (y) depende da região (x)?
Variáveis qualitativas versus variáveis quantitativas
-Variável qualitativa x: Região
-Variável quantitativa e: Consumo gasoso
Se a quantidade de litros consumidos é a mesma nas duas regiões, a conclusão será que não há dependência entre as duas variáveis. A maneira de saber é comparar a tendência média ou mediana para as duas regiões.
Caso normal
Se os dados seguiram uma distribuição normal, duas hipóteses serão levantadas: o H0 nulo e a alternativa H1 através da comparação entre os meios:
Pode atendê -lo: produtos notáveis-H0: Não há diferença entre a média das duas regiões.
-H1: Os meios de ambas as regiões são diferentes.
Caso sem - tendência normal
Pelo contrário, se os dados não seguirem uma distribuição normal ou simplesmente a amostra é muito pequena para saber, em vez de comparar a média, seria comparado A mediana Das duas regiões.
-H0: Não há diferença entre a mediana das duas regiões.
-H1: Os medianos de ambas as regiões são diferentes.
Se as medianas coincidem, a hipótese nula é cumprida: não há relação entre o consumo de refrigerante e a região.
E se o contrário acontecer, a hipótese alternativa é verdadeira: existe uma relação entre consumo e região.
É para esses casos em que o teste U de Mann - Whitney é indicado.
Amostras de amostra ou não com pares
A questão importante a seguir para decidir se o teste U de Mann Whitney é aplicado, é se o número de dados em ambas as amostras é idêntico, o que é equivalente a dizer que eles são ao mesmo tempo.
Se as duas amostras estiverem emparelhadas, a versão Wilcoxon original se aplicaria. Mas se não, como é o caso do exemplo, o teste Wilcoxon modificado é aplicado, que é precisamente o teste U de Mann Whitney.
Mann Whitney U Teste das características
O teste U de Mann -Whitney é um teste não paramétrico, aplicável a amostras que não seguem a distribuição normal ou com poucos dados. Tem as seguintes características:
1.- Compare os medianos
2.- Trabalhos em intervalos ordenados
3.- É menos poderoso, compreensão pelo poder, a probabilidade de rejeitar a hipótese nula quando, na realidade, é falsa.
Levando em consideração essas características, o teste U de Mann - Whitney é aplicado quando:
-Os dados são independentes
-Eles não seguem a distribuição normal
-A hipótese nula H0 é aceita se o meio das duas amostras coincidir: ma = mb
-A hipótese alternativa H1 é aceita se o meio das duas amostras diferentes: ma ≠ mb
Fórmula de Mann - Whitney
A variável u é a estatinidade de contraste usada no teste de Mann - Whitney e é definida:
U = min (ua, ub)
Isso significa que u é o menor dos valores entre UA e UB, aplicado a cada grupo. Em nosso exemplo, seria para cada região: a o b.
As variáveis UA e UB são definidas e calculadas de acordo com a seguinte fórmula:
Ua = nb + na (na +1)/2 - ra
Ub = nb + nb (nb +1)/2 - rb
Pode atendê -lo: redução de termos semelhantesAqui os valores de NA e NB são os tamanhos das amostras correspondentes às regiões A e B, respectivamente e, por outro somas de alcance que vamos definir abaixo.
Etapas para aplicar o teste
1.- Encomende os valores das duas amostras.
2.- Atribuir um intervalo de pedidos a cada valor.
3.- Corrija as ligantes existentes nos dados (valores repetidos).
4.- Calcule RA = soma dos intervalos da amostra a.
5.- Encontre rb = soma dos intervalos da amostra B.
6.- Determine o valor UA e UB, de acordo com as fórmulas fornecidas na seção anterior.
7.- Compare UA e UB, e o menor dos dois é atribuído à estatística experimental (ou seja, os dados) em comparação com a estatística teórica ou normal.
Aplicação prática de aplicação
Agora aplicamos o acima mencionado ao problema do refrigerante anteriormente elevado:
Região A: 16, 11, 14, 21, 18, 34, 22, 7, 12, 12
Região B: 12,14, 11, 30, 10
Dependendo de que os meios de ambas as amostras sejam estatisticamente iguais ou diferentes, passamos a aceitar ou rejeitar a hipótese nula: não há relação entre a variável e e x, ou seja, o consumo de refrigerante não depende da região:
H0: MA = MB
H1: ma ≠ mb
Figura 2. Dados de consumo gasoso nas regiões A e B. Fonte: f. Zapata.- Passo 1
Passamos a ordenar os dados em conjunto para as duas amostras, ordenando os valores do menos para o maior:
Observe que o valor 11 aparece 2 vezes (uma vez em cada amostra). Originalmente, possui posições ou faixas 3 e 4, mas não para superestimar ou subestimar uma ou outra, o valor médio é escolhido como um intervalo, ou seja, 3,5.
Da mesma forma, o valor 12 é prosseguido, que é repetido três vezes com as faixas 5, 6 e 7.
Bem, o valor 12 recebe o intervalo médio de 6 = (5+6+7)/3. E o mesmo para o valor 14, que tem ligação (aparece em ambas as amostras) nas posições 8 e 9, o intervalo médio 8 é atribuído.5 = (8+9)/2.
- Passo 2
Os dados da região A e B são então separados novamente, mas agora seus intervalos correspondentes são atribuídos em outra linha:
Região a
Região b
As faixas de RB são obtidas das somas dos elementos da segunda linha para cada caso ou região.
etapa 3
Os respectivos valores de UA e UB são calculados:
UA = 10 × 5 + 10 (10 + 1)/2 - 86 = 19
UB = 10 × 5 + 5 (5 + 1)/2 -34 = 31
Valor experimental u = min (19, 31) = 19
Passo 4
O teórico deve seguir uma distribuição normal n com parâmetros dados exclusivamente pelo tamanho das amostras:
Pode atendê -lo: números irracionais: história, propriedades, classificação, exemplosN ((Na⋅nb) /2, √ [nb (na + nb +1) /12])
Para comparar a variável ou obtida experimentalmente, com a teórica, é necessário fazer uma mudança variável. Vai da variável ou experimental ao seu valor tipificado, que será chamado Z, Para poder comparar com o de uma distribuição normal tipificada.
A mudança variável é a seguinte:
Z = (u - na.NB / 2) / √ [Na. NB (Na + NB + 1) / 12]
Deve -se notar que, para a mudança de variável, os parâmetros da distribuição teórica para u foram usados. Em seguida, a nova variável Z, que é um híbrido entre o teórico e o experimental ou uma distribuição normal tipificada n (0,1).
Critérios de comparação
Se z ≤ zα ⇒ A hipótese nula H0 é aceita
Sim z> zα ⇒ A hipótese nula H0 é rejeitada
Os valores críticos que Zα tipificou depende do nível de confiança necessário, por exemplo, para um nível de confiança α = 0,95 = 95%, o mais usual tem o valor crítico zα = 1,96.
Para os dados mostrados aqui:
Z = (u - nb / 2) / √ [nb (na + nb + 1) / 12] = -0,73
Que está abaixo do valor crítico 1,96.
Então a conclusão final é que a hipótese nula é aceita:
Não há diferença no consumo de refrigerante entre as regiões A e B.
Calculadoras on -line para o teste U de Mann - Whitney
Existem programas específicos para cálculos estatísticos, incluindo SPSS e Minitab, mas esses programas são pagos e seu uso nem sempre é simples. Isso ocorre porque eles dão tantas opções, que seu uso é praticamente reservado para especialistas em estatística.
Felizmente, existem vários programas on -line muito precisos, gratuitos e simples -que permitem, entre outros, testes u -whitney u.
Esses programas são:
-Estatísticas de Ciências Sociais (Socscistatistics.com), que tem o teste U-Whitney U e Wilcoxon no caso de amostras equilibradas ou emparelhadas.
-Estatística de terapia de IA (AI-terapia.com), que possui vários dos testes de estatística descritiva usuais.
-Estatística de usar (física.CSBSJU.Edu.
Referências
- Dietrichson. Métodos quantitativos: teste de intervalos. Recuperado de: bookdown.org
- Marín J p. Guia do SPSS: Análise e procedimentos em testes não paramétricos. Recuperado de: halweb.Uc3m.é
- MOOC USAL. Teste não paramétrico: U of Mann - Whitney. Recuperado de: youtube.com
- Wikipedia. Teste de Mann - Whitney. Recuperado de: é.Wikipedia.com
- Xlstat. Centro de ajuda. Tutorial de teste de Mann - Whitney no Excel. Recuperado de: ajuda.Xlsat.com
- « Fórmulas e equações de erro de amostragem, cálculo, exemplos
- Exemplos de dados agrupados e exercício resolvido »