Falando de Estatística Parte 1

Postado por Mauricio Dorneles

O que é Estatística?

A Estatística é uma parte da Matemática Aplicada que fornece métodos para:

coleta,organização,descrição, análise e interpretação de dados
Além de auxiliar para a utilização dos mesmos na tomada de decisões.

Fases do Trabalho Estatístico

O trabalho estatístico é um método científico, que consiste das cinco etapas básicas seguintes:

1- Coleta e crítica de dados
2- Tratamento dos dados
3- Apresentação dos dados
4- Análise e interpretação dos resultados
5- Conclusão

A coleta é direta quando feita sobre elementos informativos de registro obrigatório:

nascimentos,casamentos, importação e exportação de mercadorias,elementos pertinentes aos prontuários dos alunos de uma escola ou, ainda, quando os dados são coletados pelo próprio pesquisador através de inquéritos e questionários.

A coleta direta de dados pode ser classificada relativamente ao fator tempo em:

a) Contínua – quando feita continuamente, tal como a de nascimentos e óbitos e a de freqüência dos alunos às aulas.
b) Periódica – quando feita em intervalos constantes de tempo, como os censos e as avaliações mensais dos alunos.
c) Ocasional – Quando feita extemporaneamente, a fim de atender a uma conjuntura ou a uma emergência, como no caso de epidemias que assolam ou dizimam rebanhos inteiros.

A coleta se diz indireta quando é inferida de elementos conhecidos (coleta direta) e/ou do conhecimento de outros fenômenos relacionados com o fenômeno estudado. Como por exemplo, podemos citar a pesquisa sobre a mortalidade infantil, que é feita através de dados colhidos por uma coleta direta.
População: É a totalidade dos elementos ou de atributos dos elementos referentes a um conjunto determinado. Em termos estatísticos define-se uma população como sendo um conjunto de informações que tenham, pelo menos, uma característica em comum.

Exemplos:

Moradores de Porto Alegre;
Peças produzidas por uma máquina;
Consumidores de uma marca de sabão em pó;
Empresas produtoras de peças para relógios;
Lagartas em uma plantação de soja;
Contribuintes para a receita estadual. etc.

Amostra:


É uma parte tomada de uma população, ou um conjunto de elementos de uma população, selecionado segundo algum critério.
Uma população pode dar origem a diversas amostras, ou seja, todas as amostras estão contidas na população

AMOSTRAGEM: É o processo através do qual é selecionada uma amostra de uma população. Nesta etapa define-se quais unidades populacionais que irão fazer parte da amostra.


As razões pelas quais opta-se por realizar uma pesquisa amostral ao invés de um censo são:

   þ Economia de tempo;
   þ Economia de custos;
   þ Economia de trabalho;
   þ Quando a população for infinita ou muito grande;
   þ Quando a investigação for destrutiva.

Apesar do processo amostral apresentar estas vantagens ele acaba perdendo em precisão, pois é estudado apenas um subconjunto da população.

Nesse caso todo resultado de amostra está sujeito a um erro amostral, o que não ocorre no censo, porém este custa mais caro, leva mais tempo e dá mais trabalho, principalmente quando a população é muito grande.

Variável: É a característica que se deseja estudar de uma dada população.

Ex.: Cor dos olhos dos moradores da cidade do Porto Alegre, altura dos alunos da serie tal etc.

AMOSTRAGEM


População:

Qualquer conjunto que possui, pelo menos, uma característica em comum.
Exemplo: Produção de peças da Indústria X.

População finita:
É aquela em que é possível enumerar todos os seus elementos.

População infinita:
É aquela em que não é possível enumerar todos os seus elementos.
Uma população finita pode ser transformada, mediante processos operacionais, em infinita.
Ex.: Retirar as fichas de uma urna e, depois de cada extração, repô-las.

Pesquisa estatística: Pode ser feita através de dois processos: censo e amostragem.

CENSO: Quando é investigada todas (sem exceção) as unidades de uma população.

Uma amostragem será probabilística se todos os elementos da população tiverem probabilidade conhecida, e diferente de zero

A amostragem probabilística implica um sorteio com regras bem determinadas,cuja realização só será possível se a população for finita e totalmente acessível.

Consideraremos aqui os seguintes planos de amostragem probabilística:

1 – Amostragem Aleatória Simples
2 – Amostragem Proporcional Estratificada
3 – Amostragem Sistemática

Amostragem Aleatória Simples


Este tipo de amostragem é equivalente a um sorteio lotérico.
A Amostragem Aleatória Simples é constituída de elementos retirados ao acaso da população.
Todo elemento da população tem probabilidade fixa de ser amostrado.
Por isso é que a esse tipo de amostragem tende a produzir amostras representativas.

Exemplo: Geralmente são considerados aleatórios os seguintes processos:


• A chegada de carros a um posto de pedágio
• As chamadas telefônicas numa grande mesa de operação
• A chegada de clientes aos caixas de um supermercado
• A produção de qualquer processo mecânico
• Sucessivos lances de moeda ou de dado
• Tempo de serviço em estações de pedágio

Amostragem Sistemática


São exemplos os prontuários médicos de um hospital, os prédios de uma rua, as linhas de produção etc.
Nestes casos, a seleção dos elementos que constituirão a amostra pode ser feita por um sistema imposto pelo pesquisador.
A Amostragem Sistemática é constituída de elementos retirados da população segundo um sistema preestabelecido.
Exemplo 1: Imagine que 500 clientes estão cadastrados em sua empresa e você precisa obter uma amostra aleatória de 2% dos cadastros. Como você obteria uma amostra sistemática?

Precisamos obter uma amostra de tamanho 10. Para obter a amostra podemos dividir 500 por 10, e obter 50.
Sorteamos um número entre 1 e 50, inclusive, para ser o primeiro cadastro da mostra e a partir desse número, contamos 50 cadastros e retiramos o último para fazer parte da amostra.
Procedemos dessa forma até completarmos os 10 cadastros da amostra.

Amostragem sistemática:


O ponto de partida, na amostragem sistemática, pode ser qualquer unidade amostral e, a partir desta, escolhem-se as seguintes segundo o intervalo de seleção.
é necessário atenção quando se aplica a amostragem sistemática, porque a variável em estudo pode ter um período de variação.

Se o intervalo de seleção for igual a 30, mostrado pelos pontos A, todos os valores obtidos serão iguais.

Com este exemplo, verifica-se  que a estratégia a seguir na escolha do intervalo de seleção é garantir que todas as partes do ciclo estão representadas. Por exemplo, se o ciclo é semanal, todos os dias da semana deveriam estar igualmente representados.

Amostragem Proporcional Estratificada


Muitas vezes a população se divide em subpopulações, denominadas de Estratos.
Como é provável que a característica em estudo dessa população apresente,de estrato em estrato, um comportamento heterogêneo e, dentro de cada estrato, um comportamento homogêneo, convém que o sorteio dos elementos da amostra leve em consideração tais estratos.
A amostra proporcional estratificada é composta por elementos proveniente de todos os estratos.

Exemplo: Vamos obter uma amostra proporcional estratificada de 10% para a pesquisa da estatura de 90 alunos de uma escola onde 54 são meninos e 36 são meninas.

Temos aqui dois estratos, sexo masculino e sexo feminino.

a) O primeiro passo é determinar o tamanho da amostra em cada estrato:

b) Numeramos os alunos de 01 a 90, sendo que de 01 a 54 correspondem meninos e de 55 a 90 meninas.

c) obtemos uma amostra aleatória ou sistemática de cada sexo e reunimos as informações numa só amostra, denominada amostra estratificada.

MEDIDAS DE TENDÊNCIA CENTRAL


As medidas de posição mais importantes são as medidas de tendência central, que recebem tal denominação pelo fato de os dados observados tenderem, em geral, a se agrupar em torno dos valores centrais.
Dentre as medidas de tendência central, destaca-se as seguintes:

Média aritmética,
Moda
e Mediana.

Cada uma com um significado diferenciado, porém tendo como serventia representar um conjunto de dados.
Média, Mediana e Moda


Valor médio = (10 + 2 = 9 + 6 + 8) /5 = 7
Significado: corresponde a um “ponto de equilíbrio” (valor em torno do qual os dados se distribuem).

Moda: é o valor que ocorre com mais frequência.
Ex.: 5; 4; 3; 6; 6; 3; 1; 6; 2
Ordenando: 1; 2; 3; 3; 4; 5; 6; 6; 6
Moda: 6

Obs. geral: a mediana pode dar melhor idéia da tendência central dos dados quando existem valores discrepantes.
Ex.: 0; 7, 9; 8; 10 . Média= 6,8;
mediana = 8;
moda= não existe.

Mediana


É o número que se encontra no centro de uma série de números, estando estes dispostos segundo uma ordem.
A mediana é o valor que divide o conjunto ao meio, isto é, concentra antes e depois de si, 50% das observações ordenadas.
Mediana: é o valor que ocupa a posição central das ordenadas.
Ex: 71; 82; 57; 68; 78; 75; 64; 61; 85
Obs.1: metade dos dados são menores ou iguais à mediana.
Obs.2: no caso do número par de pontos, a mediana será a média dos pontos centrais.

Parâmetro: São medidas obtidas através dos elementos da população. Os símbolos são apresentados por letras gregas.:

 = Média, ² = Var. absoluta;  = Desvio Padrão.

Estatísticas Amostrais ou Estatísticas: São medidas obtidas através dos elementos das amostras.:
Média da Amostra = X; Variância = S²; Desvio padrão amostral = S

Medida de dispersão ou Variabilidade

Amplitude total ou intervalo total (A t)

É a diferença entre o maior e o menor valores de uma distribuição ou conjunto de dados, e pode ser expressa da seguinte forma:
A t = Xmax – Xmin
Ex.: {2; 3; 6; 9; 11; 10; 9; 7; 4}
A t = 11-2= 9

Obs.:
·        Amplitude igual a zero = não houve variabilidade
·        Quanto maior é a amplitude = maior a variabilidade
·        Amplitude não mede bem a variabilidade pois não informa nada sobre valores intermediários

Variância e Desvio Padrão


A variância é definida como a média dos desvios ao quadrado em relação à média da distribuição. Para uma amostra,

Para uma população finita,


Média e variância de x




Vejamos o seguinte exemplo: uma população consiste dos números 2,3,6,8,11.
(a) a média da população,
(b) o desvio padrão da população,


 
 
 
 
 
 
 
Exemplo: A série de dados: 7, 8, 9, 10, 10, 10, 11, 12, 12, 12, 12, 13, 15 tem moda igual a?


Amodal : são as séries nas quais nenhuma valor apareça mais vezes que outros.

Exemplo: 3, 5, 8, 10, 13.

·       Multimodal : é uma série que possui dois ou mais valores modais.
Exemplo: Xi = 2 3 4 4 4 5 6 7 7 7
Mo1 = 4 Mo2 = 7




Distribuição normal ou gaussiana


um conjunto de valores que tendem a concentrar-se em torno de um determinado valor e a curva de distribuição encontrada se apresenta na forma de um sino, perfeitamente simétrica em relação ao eixo das ordenadas.
Isso ocorre quando o número de medidas e as componentes de erro (acidentais, aleatórios) são grandes.
Quando uma medida é realizada, o valor está sujeito a inúmeros pequenos erros aleatórios, que fazem com que o valor lido possa ser muito maior ou muito menor do valor correto, dependendo do modo como se combinam.
Caso a medida que esteja sendo realizada seja designada por x, a distribuição

gausseana fornece a probabilidade de que a medida caia entre x +  x que é escrita :


 
 
 
 
 
 
 


 
 
 
 
 
 
 
 
 
 
 
 
 
 
área total sob a curva é igual a 1 ( 100%)

-para um dado valor de µ, existem infinitas curvas, cada qual com valores diferentes de s;
intervalos:

- contém 68.27% da área sob a curva -  µ +- 1 desvios
- contém 95.45% da área sob a curva -  µ +- 2 desvios

- contém 99.73% da área sob a curva -  µ +- 3 desvios



Espero que tenham gostado, na próxima postagem vamos falar de testes de hipóteses.
Até lá

Obrigado