Este documento discute testes estatísticos paramétricos e não paramétricos. Resume os principais tipos de testes, como testes t, ANOVA e testes não paramétricos como o teste de Wilcoxon. Explica quando cada tipo de teste é apropriado dependendo se as amostras seguem uma distribuição normal ou não.
4. 1. Princípios Básicos de Testes Estatísticos
Intervalos de Ao combinar a dimensão da amostra com a sua variabilidade,
confiança gera-se um intervalo de confiança para a média da
população.
Níveis de
confiança
• Como se interpreta um intervalo de confiança?
Tipos de erros • Se assumirmos que a amostra foi aleatoriamente
seleccionada de uma população que segue uma
distribuição normal, então, com 95% de confiança,
Testes
podemos dizer que o intervalo de confiança inclui a
estatísticos
média da população.
4
5. 1. Princípios Básicos de Testes Estatísticos
Intervalos de Com base nos intervalos de confiança, podem ser calculados
confiança intervalos de confiança para a diferença das médias dos
grupos. Podem ainda ser criados intervalos de confiança para
Níveis de proporções, rácios, o declíve de uma regressão linear ou
confiança outro qualquer parâmetro estatístico.
Tipos de erros
Testes
estatísticos
5
6. 1. Princípios Básicos de Testes Estatísticos
Intervalos de A maioria dos intervalos de confiança são calculados para
confiança 95% mas também podem ser utilizados outros níveis de
confiança.
Níveis de
confiança
Se se pretende um nível de confiança maior, i.e., se se quer
mais confiança de que um intervalo contém o parâmetro real,
Tipos de erros
então o intervalo tem de ser maior. Assim sendo, os intervalos
de confiança a 99% são mais amplos que os de 95% e os de
Testes 90% são mais estreitos que os de 95%.
estatísticos
6
7. 1. Princípios Básicos de Testes Estatísticos
Intervalos de Intuitivamente, somos levados a dizer que um p-value de
confiança 0.01 seria estatisticamente mais significante do que um p-
value de 0,005, mas tal não é correcto. A partir do momento
Níveis de em que é definido o nível de confiança, todos os resultados
confiança são ou ‘estatisticamente significantes’ ou ‘estatisticamente
não significantes’.
Tipos de erros
No entanto, há autores que fazem uma distinção do grau de
significância e utilizam simbolos para o fazer mas estas
denominações e notações não estão estandardizadas.
Testes
estatísticos Por exemplo:
P value Descrição Notação
>0.05 Não significante ns
0.01 to 0.05 Significante *
0.001 to 0.01 Muito significante **
< 0.001 Extremamente significante ***
7
8. 1. Princípios Básicos de Testes Estatísticos
Intervalos de Tipos de erros:
confiança
Hipótese verdadeira
Níveis de Ho H1
confiança
Decisão do Rejeita Ho Erro do tipo I ✔
Tipos de erros teste Não rejeita Ho ✔ Erro do tipo II
Testes P (erro do tipo I) =α
estatísticos Tamanho do teste ou nível de significância: α = P (erro do
tipo I) = P (rejeitar Ho | Ho verdadeiro)
P (erro do tipo II) = β
Potência do teste = 1- β = 1 - P (erro do tipo II) = P (rejeitar
Ho | H1 verdadeiro)
8
9. 1. Princípios Básicos de Testes Estatísticos
Intervalos de • Os testes estatísticos procuram confirmar se uma
confiança determinada hipótese (Ho) pode ser rejeitada.
Níveis de • Os testes podem ser bilaterais ou unilaterais:
confiança
• Nos testes bilaterais:
Tipos de erros • A hipótese nula (Ho) inclui sempre o sinal de
igual
• A hipótese alternativa (H1) inclui sempre o sinal
Testes
de desigual
estatísticos
• Nos testes unilaterais:
• A hipótese nula (Ho) inclui o sinal de maior ou
igual
• A hipótese alternativa (H1) inclui o sinal oposto
9
10. 1. Princípios Básicos de Testes Estatísticos
Intervalos de Testes bilaterais versus unilaterais:
confiança
• Num teste t, o p-value é calculado para a hipótese nula
Níveis de das duas populações terem médias iguais e que qualquer
confiança discrepância que exista entre duas amostras é arbitrária.
Tipos de erros • O p-value nos testes unilateriais é duas vezes o p-value
dos testes bilaterais.
Testes
• Os testes unilaterais são apropriados quando se pode
estatísticos
afirmar com certeza (mesmo antes de recolher dados),
que ou não haverá diferença entre as médias, ou a
diferença é no sentido que se especifica. Caso contrário,
devem usar-se testes bilaterais, que geralmente são
aconselhados.
10
12. 2. Testes Paramétricos e Não Paramétricos
Existem dois tipos de testes:
• Os testes paramétricos (também chamados testes t):
• Exigem que a(s) amostra(s) tenha(m) uma distribuição normal,
especialmente se tiverem uma dimensão inferior a 30.
• Nas amostras de dimensão superior a 30, a distribuição aproxima-se
da distribuição normal e também se aplicam os testes t.
• Os testes não paramétricos:
• Não necessitam de requisitos tão fortes, como a normalidade, como
os testes paramétricos, para serem usados. São também indicados
quando as amostras são pequenas.
• São usados quando a amostra tem uma distribuição que não é
normal ou quando, apesar da amostra ter uma dimensão superior a
30, se opta por conclusões mais conservadoras.
• A desvantagem destes testes é que não são tão potentes quanto os
testes paramétricos, ou seja, com os testes não paramétricos não se
encontram tantas diferenças entre os dados, quando essas
diferenças realmente existem.
12
13. 2. Testes Paramétricos e Não Paramétricos
• Os testes paramétricos pressupõem a normalidade em amostras de
dimensão igual ou inferior a 30. Nas amostras de dimensão
superior, a distribuição aproxima-se da distribuição normal e
também se aplicam os testes t.
• Quando não se pode pressupor a normalidade recorre-se aos testes
não paramétricos.
Paramétricos Não paramétricos
Distribuição assumida Normal Qualquer uma
Variância assumida Homogénea Qualquer uma
Tipo de variáveis
De intervalo ou rácio Ordinal ou nominal
normalmente usadas
Relação entre os dados Independentes Qualquer uma
Medidas de localização
Média Mediana
central normalmente usadas
13
14. 2. Testes Paramétricos e Não Paramétricos
Tipo de dados
Ordem, resultado ou
Binomial (dois
Medida (de medida (de Tempo de
Objectivo resultados
populações normais) populações não sobrevivência
possíveis)
normais)
Mediana e amplitude Curva de sobrevivência
Descrever um grupo Média e desvio padrão Teste de proporção
inter-quartil de Kaplan Meier
Teste para uma só Teste do chi-
Comparar um grupo a Teste de
amostra (one-sample t quadrado ou teste
um valor hipotético Wilcoxon
test) binomial
Teste para duas
Teste de Fisher ou o
Comparar dois grupos amostras Teste de Teste de Log-rank ou
chi-quadrado de
independentes independentes Mann-Whitney Mantel-Haenszel
amostra grande
(Unpaired t test)
Teste para amostras
Comparar dois grupos Conditional proportional
emparelhadas (Paired t Teste de Wilcoxon Teste de McNemar
emparelhados hazards regression
test)
Comparar dois ou mais Regressão de Cox (Cox
One-way ANOVA Teste de Kruskal-Wallis Teste do chi-quadrdo
grupos independentes proportional hazard)
Regressão condicional
Comparar dois ou mais Repeated-measures proporcional (conditional
Teste de Friedman Cochran Q**
grupos emparelhados ANOVA proportional hazards
regression)
Quantificar a
Correlação de Coeficientes de
associação entre duas Correlação de Pearson
Spearman contigência **
variáveis
Prever valores apartir Regressão linear
Regressão não Regressão logística Regressão de Cox (Cox
de outra variável simples ou regressão
paramétrica simples proportional hazard)
medida não linear
Prever valores apartir
Regressão linear Regressão logística Regressão de Cox (Cox
de várias variáveis
múltipla múltipla proportional hazard)
binomiais ou medidas
14
15. 2. Testes Paramétricos e Não Paramétricos
Testar a normalidade:
Como os testes paramétricos pressupõem a normalidade em amostras de
dimensão igual ou inferior a 30, pode ser necessário testar se a amostra tem
uma distribuição normal.
Para testar a aderência à normalidade, i.e., para testar se a amostra se pode
pressupor normal, podem-se usar dois testes:
• Teste de Kolmogorov-Smirnov com correcção de Lilliefors
• Teste de Shapiro-Wilks
15
16. 2. Testes Paramétricos e Não Paramétricos
• Tipos de testes paramétricos:
• Testes t:
• Teste para duas amostras independentes (teste t e testes t
simultâneos) (unpaired t test)
• Teste para duas amostras emparelhadas (paired t test)
• Teste para uma só amostra (one sample t test)
• Testes ANOVA (I e II)
• Os testes ANOVA (analysis of variance) diferencia-se dos testes t
porque os testes t só podem ser usados para testar diferenças entre
duas situações para uma variável. Os testes ANOVA podem ser usados
para testar diferenças entre diversas situações e para duas ou mais
variáveis.
16
17. 2. Testes Paramétricos e Não Paramétricos
• Tipos de testes não paramétricos:
• Testes para amostras emparelhadas:
• Teste do sinal
• Teste de McNemar
• Teste Q de Cochran
• Testes de Wilcoxon
• Teste de Friedman
• Testes para amostras independentes:
• Teste de Mann-Whitney
• Teste de Kruskal-Wallis
• Teste de Wald-Wolfowitz ou teste de aleatoriedade da amostra
• Teste de Moses para reacções extremas
• Outros testes:
• Teste binomial
• Teste de ajustamento do Qui-Quadrado
• Teste de independência do Qui-Quadrado
• Teste de Fisher 17
19. 3. Testes Paramétricos
Testes t Testes para amostras independentes:
Para amostras
independentes • A comparação das médias é feita entre os casos de
Para amostras
uma variável numa das amostras com os casos
emparelhadas dessa variável na outra amostra (teste t)
• A comparação das médias é feita entre os casos de
Para uma
um grupo de variáveis numa das amostras com os
amostra
casos dessa variável na outra amostra (testes
Testes ANOVA simultâneos)
ANOVA I
ANOVA II Exemplo: Testar se o rendimento médio dos homens é semelhante
ao das mulheres (teste de uma só variável) ou testar se o rendimento
médio e os gastos médios são semelhantes entre homens e
mulheres (testes simultâneos).
Teste t Testes simultâneos
Ho: UR homens = UR mulheres Ho: UR homens = UR mulheres Ho: UG homens = UG mulheres
H1: UR homens ≠ UR mulheres H1: UR homens ≠ UR mulheres H1: UG homens ≠ UG mulheres
Sendo UR o rendimento médio Sendo UR o rendimento médio Sendo UG os gastos médio
19
20. 3. Testes Paramétricos
Testes t Testes para amostras emparelhadas:
Para amostras
independentes Este teste é usado em duas situações:
• Quando, para o mesmo grupo de sujeitos, se mede uma variável
Para amostras
antes e depois de um evento; ou
emparelhadas
• Quando se mede uma variável numa amostra que inclui dois
Para uma grupos de sujeitos com características que podem ser
amostra semelhantes
Testes ANOVA
Nas hipóteses do teste compara-se o valor da diferença
ANOVA I entre os pares de observações e testa-se se a média das
ANOVA II diferenças pode ser zero:
Exemplo 1: Testar se a motivação de um indivíduo no final do evento é semelhante à
motivação que tinha no início.
Exemplo 2: Testar se o rendimento de dois anos pode ser considerado semelhante.
Teste amostras emparelhadas
Ho: Udiferença =UR 2010 - UR 2009 = 0
H1: Udiferença =UR 2010 - UR 2009 ≠ 0
Sendo UR o rendimento médio 20
21. 3. Testes Paramétricos
Testes t Testes para uma amostra
Para amostras
independentes • Este teste compara os valores observados da
Para amostras
amostra com um valor que se quer testar.
emparelhadas
Exemplo 1: Testar se a taxa de desemprego é de 10%.
Para uma Exemplo 2: Testar se a satisfação média dos clientes pode ser 9,5.
amostra
Testes ANOVA
ANOVA I
ANOVA II
Teste t uma amostra
Ho: Us = 9.5
H1: Us ≠ 9.5
Sendo Us a satisfação média
21
22. 3. Testes Paramétricos
Testes t Teste ANOVA I
Para amostras
independentes Na análise da variância, a variabilidade observada na
Para amostras
amostra divide-se em duas componentes:
emparelhadas • Variabilidade das observações dentro de um grupo,
em torno da média (dentro dos grupos);
Para uma
• Variabilidade entre as médias dos grupos (entre
amostra
grupos).
Testes ANOVA
ANOVA I Se a variabilidade entre grupos for suficientemente grande
face à variabilidade dentro dos grupos, rejeita-se a hipótese
ANOVA II
nula, que afirma que todas as médias da população iguais.
Exemplo: Testar os resultados da aprendizagem resultantes da utilização de 4
métodos de ensino diferentes usados em 4 turmas ou grupos.
Exemplo: Testar o número médio de horas de trabalho semanais por grau
académico.
22
23. 3. Testes Paramétricos
Testes t Teste ANOVA II
Para amostras
independentes ANOVA II é utilizado quando existe mais do que um factor
Para amostras
para definir os grupos.
emparelhadas
Exemplo: Testar a motivação dos alunos por idade e por sexo
Para uma A hipótese nula será que o efeito da idade sobre a motivação dos alunos é o
amostra mesmo para homens e mulheres, ou seja, não há interacção entre a idade e o
sexo.
Testes ANOVA
ANOVA I
ANOVA II
23
25. 4. Testes Não Paramétricos
Amostras independentes ou emparelhadas?
• Ao comparar dois grupos, é necessário decidir se se usam testes para
amostras independentes ou emparelhadas.
• Usam-se testes para amostras emparelhadas para comparar valores que
são diferentes medidas de um individuo (por exemplo, antes e depois de
um evento) ou medidas de individuos emparelhados (por exemplo, um
casal).
• Os testes para amostras emparelhadas só são apropriados quando os
individuos foram emparelhados antes de recolher os dados. Não se pode
basear o emparelhamento nos dados recolhidos.
25
26. 4. Testes Não Paramétricos
Amostras Teste do sinal
emparelhadas
Teste do sinal A hipótese nula no teste do sinal afirma que a diferença
média entre dois membros de um par é zero.
Teste de
McNemar
Teste Q de
Cochran Exemplo: Testar que a motivação de um aluno para um curso ou disciplina é
Teste de igual à motivação que tem para outro curso ou disciplina.
Wilcoxon
Teste de
Friedman
Amostras
independentes
Outros testes
26
27. 4. Testes Não Paramétricos
Amostras Teste de McNemar
emparelhadas
Teste do sinal O teste de McNemar é um teste do sinal aplicado a variáveis
dicotómicas, ou seja, a variáveis que apenas tomam dois
Teste de
McNemar valores (por exemplo: sim/não).
Teste Q de
Cochran Exemplo: Testar se, numa determinada licenciatura, a hipótese nula de que há
Teste de igualdade entre rapazes e raparigas de terem irmãos.
Wilcoxon
Teste de
Friedman
Amostras
independentes
Outros testes
27
28. 4. Testes Não Paramétricos
Amostras Teste Q de Cochran
emparelhadas
Teste do sinal O teste Q de Cochran é uma generalização do teste de
McNemar. Este teste permite comparar proporções em mais
Teste de
McNemar do que duas amostras emparelhadas onde cada variável é
dicotómica (assumindo os valores 1 e 0).
Teste Q de
Cochran
Ho: a proporção p é igual em todas as amostras
Teste de emparelhadas.
Wilcoxon
Teste de Exemplo: Testar se, numa determinada licenciatura, a hipótese nula de que a
Friedman proporção de alunos reprovados nas 3 chamadas de exame de uma disciplina é
igual.
Amostras
independentes
Outros testes
28
29. 4. Testes Não Paramétricos
Amostras Teste de Wilcoxon
emparelhadas
Teste do sinal O teste de Wilcoxon é mais rico que o teste do sinal pois, ao
contrário deste que apenas verifica qual dos dois números de
Teste de
McNemar um par é maior, o teste de Wilcoxon verifica a magnitude
dessa diferença.
Teste Q de
Cochran
Este teste exige que as diferenças sejam de uma amostra de
Teste de uma distribuição simétrica, pelo que, antes de ser aplicado,
Wilcoxon deve ser feito o histograma da amostra para ver se a sua
Teste de distribuição se pode assumir como simétrica.
Friedman
Amostras
independentes
Outros testes
29
30. 4. Testes Não Paramétricos
Amostras Teste de Friedman
emparelhadas
Teste do sinal O teste de Friedman é usado quando existem mais do que 2
condições de emparelhamento, onde cada variável é
Teste de
McNemar classificada numa escala de nível, pelo menos, ordinal.
Teste Q de
Este teste é usado para comparar as preferências das
Cochran
pessoas.
Teste de
Wilcoxon
Teste de Exemplo: Testar a hipótese nula de que não há preferência entre 3 produtos.
Friedman Os inquiridos indicam porque ordem preferem os produtos e o teste verifica se
há preferência. Rejeitada Ho, o rank dirá qual é o produto mais preferido (e o
Amostras menos preferido) .
independentes
Outros testes
30
31. 4. Testes Não Paramétricos
Amostras Teste de Friedman
emparelhadas
Teste do sinal Este teste não usa os dados directamente mas sim a ordem
por eles ocupada (o rank), depois de serem organizados de
Teste de
McNemar forma crescente. A ordenação é feita de forma separada para
cada uma das amostras, e não em conjunto.
Teste Q de
Cochran
Este teste funciona como uma análise de variância a dois
Teste de critérios de variação. Por exemplo, em “A satisfação de clientes de vários
Wilcoxon produtos pode ser avaliada por diferentes métodos”, os critérios seriam os
produtos e os métodos. O teste procura responder à questão: É identica a
Teste de
avaliação da satisfação pelos vários produtos, em relação aos diferentes
Friedman métodos? Ou, de outra forma, há concordância entre os diversos métodos em
Amostras relação à avaliação dos produtos?
independentes
A organização dos dados é relevante: o factor principal deve
Outros testes ser colocado em coluna.
Ho será que a distribuição das ordens nas diversas colunas
será mais ou menos equivalente, de modo a que a soma da
ordem em cada coluna seja aproximadamente igual.31
32. 4. Testes Não Paramétricos
Amostras Teste de Mann-Whitney
emparelhadas
Amostras O teste de Mann-Whitney é a alternativa não paramétrica ao
independentes teste t para amostras independentes.
Teste de Mann-
O requisito deste teste é que os grupos tenham a mesma
Whitney
distribuição (que não precisa de ser normal).
Teste de Kruskal-
Wallis
Neste teste, a hipótese nula é que as médias da população
Teste de Wald- são as mesmas para os dois grupos.
Wolfowitz
Teste de Moses
para reacções
extremas
Outros testes
32
33. 4. Testes Não Paramétricos
Amostras Teste de Kruskal-Wallis
emparelhadas
Amostras O teste de Kruskal-Wallis é a alternativa não paramétrica ao
independentes teste ANOVA I.
Teste de Mann-
É calculado como o teste de Mann-Whitney, com a diferença
Whitney
que podem existir mais grupos.
Teste de Kruskal-
Wallis
Os requisitos deste teste são:
Teste de Wald- • Que os grupos tenham a mesma distribuição (que não
Wolfowitz precisa de ser normal);
Teste de Moses
para reacções Neste teste, a hipótese nula é que as médias da população
extremas são as mesmas para os dois grupos.
Outros testes
33
34. 4. Testes Não Paramétricos
Amostras Teste de Wald-Wolfowitz ou teste de aleatoriedade da
emparelhadas amostra (runs test)
Amostras
independentes O teste de sequência de Wald-Wolfowitz, ou run test, testa a
hipótese nula de que uma sequência de valores é aleatória.
Teste de Mann-
Whitney
Este teste só se aplica em variáveis dicotómicas.
Teste de Kruskal-
Wallis
Este teste avalia se o número de runs de uma série ordenada
Teste de Wald- é aleatório ou não. Uma amostra de m valores independentes
Wolfowitz da primeira população é combinada com uma amostra de n
Teste de Moses valores da segunda população e na amostra combinada é
para Reacções feito o rank. O teste foca-se no número de runs, sendo o run
Extremas uma sucessão de valores adjacentes ordenados da mesma
Outros testes população que são precedidos ou seguidos no rank por
valores da outra população ou por nenhum outro valor.
34
35. 4. Testes Não Paramétricos
Amostras Teste de Wald-Wolfowitz ou teste de aleatoriedade da
emparelhadas amostra (runs test)
Amostras
independentes Exemplo 1:
Ao inquirir os individuos se gostam de um determinado
Teste de Mann-
professor, observa-se a seguinte sequência (S= sim e N=
Whitney
não): NNNNSSSNNSSSNNSSNNNNSSSSSN
Teste de Kruskal- O que este teste faz é pegar na sequência de símbolos iguais
Wallis
(NNNN SSS NN SSS NN SS NNNN SSSSS N) e ver se eles
Teste de Wald- podem ser aleatórios.
Wolfowitz
Teste de Moses Exemplo 2:
para Reacções Fonte: http://www.quantitativeskills.com/sisa/statistics/ordhlp.htm
Extremas Rank order 1 2 3 .................................................. 31
Outros testes Data MMMFFFMMMMFFMMMFFFFFFFMMFMMFFFF
run number 1112223333445556666666778990000
O número de runs esperado é de 16. O p-value do teste será
a probabilidade da diferença entre o número esperado e o
número observado.
35
36. 4. Testes Não Paramétricos
Amostras Teste de Moses para reacções extremas
emparelhadas
Amostras Este teste aplica-se quando existe uma suspeita de que uma
independentes determinada condição experimental afectou um grupo de
indivíduos e, de forma oposta, outro grupo.
Teste de Mann-
Whitney
É indicado quando existe um grupo experimental e um grupo
Teste de Kruskal- de controle e se suspeita que no grupo experimental os
Wallis
valores estão concentrados numa (ou em ambas) as
Teste de Wald- extremidades da série.
Wolfowitz
Teste de Moses Este teste exige que a escala seja, pelo menos, ordinal.
para Reacções
Extremas
Outros testes
36
37. 4. Testes Não Paramétricos
Amostras Teste binomial
emparelhadas
Amostras O teste binomial compara a distribuição de uma variável
independentes dicotómica com uma determinada probabilidade, obtida da
amostra ou definida (cut point).
Outros testes
Teste binominal A hipótese nula deste teste é que a probabilidade de
Teste de ocorrência de observação no primeiro grupo é x%.
ajustamento
Teste de Se a probabilidade de ocorrência para um grupo é p, então a
independência probabilidade de ocorrência para o outro grupo é q = 1-p.
Teste de Fisher
Ao realizar o teste, se a variável é dicotómica, opta-se por
obter a dicotomia dos dados. Caso contrário, define-se um
cut point, ou seja, um ponto de transição que permita definir
os grupos. Indica-se também a probabilidade que se pretende
testar.
37
38. 4. Testes Não Paramétricos
Amostras Teste do ajustamento do Qui-Quadrado
emparelhadas
Amostras O teste do ajustamento do Qui-Quadrado compara as
independentes frequências observadas na amostra com as frequências
esperadas.
Outros testes
Teste binominal A hipótese nula deste teste afirma que os valores observados
Teste de se ajustam aos valores esperados.
ajustamento • Exemplo: que um pacote de Sugus contenha iguais proporções
de Sugus vermelhos, azuis, amarelos e verdes.
Teste de
• Exemplo: que um pacote de Sugus contenha 30% deSugus
independência
vermelhos, 20% de azuis, 25% de amarelos e 25% verdes.
Teste de Fisher
Uma distribuição pode ser aproximada ao Qui-Quadrado se
cumprir duas condições:
Não existirem mais de 20% de categorias com valores
esperados inferiores a 5; e
Todas as categorias tenham valores esperados superiores
ou iguais a 1.
38
39. 4. Testes Não Paramétricos
Amostras Teste de independência do Qui-Quadrado
emparelhadas
Amostras O teste de independência do Qui-Quadrado permite verificar
independentes se duas variáveis estão relacionadas.
Outros testes A hipótese nula deste teste afirma que a variável X1 e a
Teste binominal variável X2 não estão relacionadas.
Teste de Por exemplo: verificar se há relação entre a variável nominal
ajustamento grau académico de um individuo e a variável que indica se
Teste de concorda que é bem pago.
independência
Nota: No SPSS, este teste é realizado através do menu Analyze/Descriptive
Teste de Fisher statistics/Crosstabs
39
40. 4. Testes Não Paramétricos
Amostras Teste de Fisher
emparelhadas
Amostras O teste de Fisher é usado quando se quer fazer um teste de
independentes independência do Qui-quadrado mas uma ou mais células
têm um valor esperado igual ou inferior a 5.
Outros testes
Teste binominal (O teste do Qui-quadrado requer que todos os valores
Teste de tenham um frequência esperada igual ou superior a 5 mas o
ajustamento teste de Fisher não exige isso).
Teste de
independência
Teste de Fisher
40
41. 4. Testes Não Paramétricos
Amostras Teste de Fisher ou Teste do Chi-quadrado?
emparelhadas
Amostras • Ao analisar tabelas de contigência de duas linhas e duas
independentes colunas, pode-se usar o teste de Fisher ou o teste do chi-
quadrado.
Outros testes • O teste de Fisher é o mais adequado porque fornece
Teste binominal sempre o valor exacto do p-value.
• O teste do chi-quadrado é mais fácil de calcular mas apenas
Teste de
dá um p-value aproximado.
ajustamento
• O teste do chi-quadrado deve ser evitado quando os
Teste de números na tabela de contigência são muito pequenos
independência
(qualquer um abaixo de 6). Se os números forem maiores,
Teste de Fisher o p-value que o teste do chi-quadrado dá será semelhante
ao p-value do teste de Fisher.
• Para corrigir o p-value do teste do chi-quadrado pode-se usar a
correcção de continuidade de Yates. Sem esta correcção, o p-value
do teste do chi-quadrado será muito baixo. Há autoes que dizem que
a correcção de Yates resulta num p-value demasiado alto. Esta
correcção não é necessária em amostras grandes nem no teste de
Fisher.
41
42. 4. Testes Não Paramétricos
Testes não paramétricos
Duas amostras K amostras
Uma amostra Amostras Amostras Amostras Amostras
Escala
emparelhadas independentes emparelhadas independentes
Teste de Fisher
Teste do Qui-
Teste binomial Teste do qui-
Teste Q de quadrado para k
Nominal Teste do qui- Teste de McNemar quadrado para 2
Cochran amostras
quadrado amostras
independentes
independentes
Teste da mediana
Teste de Mann-
Whitney
Teste de
Teste de
Kolmogorov-
Kolmogorov-
Smirnov para uma
Teste do sinal Smirnov para duas
amostra Teste de Kruskal-
Ordinal amostras Teste de Friedman
Wallis
Teste de Wilcoxon
Teste de iterações
Teste de Wald-
para uma amostra
Wolfowitz
Teste de Moses
para reacções
extremas
Teste de Walsh
Teste de
aleatoriedade para
Intervalo Teste de
2 amostras
aleatoriedade para
independentes
pares
42
Fonte: Adaptado de Siegel, Sidney. Estatística Não-paramétrica Para as Ciências do Comportamento. São Paulo: McGraw-Hill, 1975.