Dados não agrupados exemplos e exercícios resolvidos
- 3121
- 629
- Pete Wuckert
O Dados não agrupados Eles são aqueles que, obtidos de um estudo, ainda não estão organizados por classes. Quando é um número gerenciável de dados, geralmente 20 ou menos, e existem poucos dados diferentes, eles podem ser tratados como não agrupados e extrair informações valiosas deles.
Os dados não agrupados vêm como é da pesquisa ou do estudo realizado para obtê -los e, portanto, não possuem processamento. Vejamos alguns exemplos:
figura 1. Os dados não agrupados são diretamente de qualquer estudo e não foram classificados. Fonte: pxhere.-Resultados de um exame de IC de coeficiente intelectual em 20 estudantes aleatórios de uma universidade. Os dados obtidos foram os seguintes:
119, 109, 124, 119, 106, 112, 112, 112, 112, 109, 112, 124, 109, 109, 109, 106, 124, 112, 112.106
-Idades de 20 funcionários de uma cafeteria muito popular:
24, 20, 22, 19, 18, 27, 25, 19, 27, 18, 21, 22, 23, 19, 22, 27, 29, 23, 20, 20
-As notas finais médias de 10 alunos de uma aula de matemática:
3.2; 3.1; 2,4; 4.0; 3.5; 3.0; 3.5; 3.8; 4.2; 4.9
[TOC]
Propriedades de dados
Existem três propriedades importantes que caracterizam um conjunto de dados estatísticos são agrupados ou não, que são:
-Posição, qual é a tendência dos dados a serem agrupados em torno de certos valores.
-Dispersão, Um indicativo de quão dispersados ou disseminados são os dados em torno de um determinado valor.
-Forma, Refere -se à maneira como os dados são distribuídos, o que pode ser visto quando um gráfico deles é construído. Existem curvas muito simétricas e também tendenciosas, à esquerda ou à direita de um certo valor central.
Para cada uma dessas propriedades, existem várias medidas que as descrevem. Uma vez obtidos, eles nos dão um panorama de comportamento de dados:
-As medidas de posição mais usadas são uma média aritmética ou simplesmente médias, mediana e moda.
-Na dispersão, o intervalo, a variação e o desvio padrão são usados com frequência, mas eles não são as únicas medidas de dispersão.
Pode atendê -lo: homotecia-E para determinar a forma, a média e a mediana são comparadas através do viés, como será visto em breve.
Cálculo da média, mediana e moda
-A média aritmética, Também conhecido como média e indicado como x, é calculado da seguinte forma:
X = (x1 + x2 + x3 +... xn) / n
Onde x1, x2,.. . xn, são os dados e n é o total deles. Em somação da soma, existe:
Aqui, o índice eu representa os dados 1, dados 2, dados 3 e assim por diante, até chegar ao único, que é o último.
-A mediana É o valor que aparece no meio de uma sucessão ordenada de dados; portanto, para obtê -los, é necessário ordenar os dados primeiro.
Se o número de observações for estranho, não há problema em encontrar o ponto médio do conjunto, mas se tivermos um par de dados, os dois dados centrais serão procurados e calculados.
-Moda É o valor mais comum observado no conjunto de dados. Nem sempre existe, pois é possível que nenhum valor seja repetido com mais frequência do que outro. Também pode haver dois dados com igual frequência; nesse caso, se fala de uma distribuição bi-modal.
Ao contrário das duas medidas anteriores, a moda pode ser usada com dados qualitativos.
Vamos ver como essas medidas de posição são calculadas com um exemplo:
Exemplo resolvido
Suponha que você queira determinar a média aritmética, a mediana e a moda no exemplo proposto no início: as idades de 20 funcionários de uma cafeteria:
24, 20, 22, 19, 18, 27, 25, 19, 27, 18, 21, 22, 23, 19, 22, 27, 29, 23, 20, 20
O metade É calculado simplesmente adicionando todos os valores e dividindo por n = 20, que é o número total de dados. Desta maneira:
Pode atendê -lo: relações de proporcionalidade: conceito, exemplos e exercíciosX = (24 + 20 + 22 + 19 + 18 + 27+ 25 + 19 + 27 + 18 + 21 + 22 + 23 + 21+ 19 + 22 + 27+ 29 + 23+ 20) / 20 =
= 22.3 anos.
Para encontrar o mediana É necessário solicitar o conjunto de dados primeiro:
18, 18, 19, 19, 19, 20, 20, 21, 21, 22, 22, 22, 23, 23, 24, 25, 27, 27, 27, 29
Como são alguns dados, os dois dados centrais, destacados em negrito, são tomados e médios. Porque ambos têm 22 anos, a mediana é de 22 anos.
finalmente, o moda É o fato que é mais repetido ou que cuja frequência é maior, sendo esses 22 anos.
Alcance, variação, desvio padrão e viés
O intervalo é simplesmente a diferença entre o major e o menor dos dados e permite que sua variabilidade aprecie rapidamente. Mas, além, existem outras medidas de dispersão que oferecem mais informações sobre a distribuição de dados.
Variação e desvio padrão
A variação é indicada como S e é calculada pela expressão:
É frequentemente trabalhado com a quase-fio em vez da variação, que é calculada da mesma maneira, dividida apenas por N-1, em vez de fazer entre n:
Como a variação é a soma dos quadrados, resulta no quadrado da unidade de amostra. Por exemplo, no estudo das idades dos funcionários da cafeteria, a variação ocorreria em anos2.
Então, para interpretar corretamente os resultados, o desvio padrão como a raiz quadrada da variação, ou também a quase-desvio padrão, é definida, que é a raiz quadrada da quase-natalidade:
Viés
É a comparação entre o x médio e o mediano med:
-Sim med = mídia x: os dados são simétricos.
-Quando x> med: tendenciosos para a direita.
-E se x < Med: los datos sesgan hacia la izquierda.
Exercício resolvido
Encontre média, mediana, moda, classificação, variação, desvio padrão e viés para os resultados de um exame de coeficiente intelectual de 20 estudantes de uma universidade:
Pode atendê -lo: funções matemáticas119, 109, 124, 119, 106, 112, 112, 112, 112, 109, 112, 124, 109, 109, 109, 106, 124, 112, 112, 106
Solução
Pediremos os dados, pois será necessário encontrar a mediana.
106, 106, 106, 109, 109, 109, 109, 109, 112, 112, 112, 112, 112, 112, 119, 119, 124, 124, 124
E nós os colocaremos em uma mesa da seguinte maneira, para facilitar os cálculos. A segunda coluna intitulada "acumulada" é a soma dos dados correspondentes mais o anterior.
Esta coluna encontrará facilmente a média, dividindo o último acumulado entre o número total de dados, como visto no final da coluna "acumulada":
X = 112.9
A mediana é a média dos dados centrais destacados em vermelho: número 10 e número 11. Como são iguais, a mediana é 112.
Finalmente, a moda é o valor mais repetido e é 112, com 7 repetições.
Quanto às medidas de dispersão, o intervalo é:
124-106 = 18.
A variação é obtida dividindo o resultado final da coluna certa entre n:
S = 668.6/20 = 33.42
Nesse caso, o desvio padrão é a raiz quadrada da variação: √33.42 = 5.8.
Por outro lado, os valores da quaseza e do desvio padrão quase são:
sc= 668.6/19 = 35.2
Quase-desvio padrão = √35.2 = 5.9
Finalmente, o viés é um pouco à direita, já que a média de 112.9 é maior que a mediana 112.
Referências
- Berenson, m. 1985. Estatística para administração e economia. Inter -American S.PARA.
- Canavos, g. 1988. Probabilidade e estatística: aplicações e métodos. McGraw Hill.
- DeVore, j. 2012. Probabilidade e estatística para engenharia e ciência. 8º. Edição. Cengage.
- Levin, r. 1988. Estatísticas para administradores. 2º. Edição. Prentice Hall.
- Walpole, r. 2007. Probabilidade e estatística para engenharia e ciência. Pearson.
- « Graus de liberdade como calculá -los, tipos, exemplos
- Tipos de axiomas de probabilidade, explicação, exemplos, exercícios »