quarta-feira, 27 de maio de 2015

Análise Bivariada – NUMÉRICA X CATEGÓRICA (Stata)

Para começar, deve-se analisar a normalidade das variáveis numéricas (rever post anterior)!

Análise 1: Numéricas por categóricas

Passo 1: Se a variável categórica (varcateg) tiver 2 classes (dicotômica), a comparação é entre 2 médias.

# 2 médias de distribuição normal - Teste t de Student
COMANDO DIGITADO: ttest varnum, by( varcateg)
OUTROS COMANDOS:
ttest variavel == v
Onde v é valor para saber se uma variável tem uma média de valor específico.
ttest variavel1 == variavel2 , unpaired
Para identificar se duas variáveis têm a mesma média, para dados não-pareados (amostras independentes).
ttest variavel1 == variavel2
Para dados pareados.
ttesti #obs1 #mean1 #sd1 #obs2 #mean2 #sd2
Forma imediata de comparação de médias de duas amostras.

EXERCÍCIO 1 ____________________________________________________________________
Analisar se há diferença entre as médias das variáveis numéricas normais com o desfecho “obesidade_criança”, variável categórica dicotômica. Preencher a tabela.
COMANDO DIGITADO:
ttest idade, by ( obesidade_criança) 

Tabela 1 – Variáveis normais com desfecho dicotômico:
Criança
n
Média
DP
IC95%
*p-valor
Idade  





Não obeso
57
7,02
1,37
6,65-7,38
0,443
Obeso
56
6,82
1,34
6,46-7,18

 *O p-valor é o bicaudal.

# 2 médias de distribuição NÃO-normal - Mann-Whitney
COMANDO DIGITADO:
ranksum varnum, by( varcateg) - Para amostras independentes.
signrank - Para dados pareadas, usando teste de Wilcoxon, a hipótese nula é que as distribuições são iguais.
signtest - Também testa a igualdade de observações pareadas através do cálculo das diferenças entre variável e a expressão (ou outra variável). A hipótese nula é que a média das diferenças é igual a zero.

EXERCÍCIO 2:____________________________________________________________________
Analisar se há diferença entre as medianas das variáveis numéricas não-normais com o desfecho “obesidade_criança”, variável categórica dicotômica. Preencher a tabela.
COMANDO DIGITADO:
ranksum perimetro_braquial, by(obesidade_crianca)
bysort obesidade_crianca: sum perimetro_braquial, d
O comando bysort mostra os valores de mediana, P25, P75, pelas categorias da variável “obesidade_criança”.

Tabela 2 – Variáveis não-normais com desfecho dicotômico
Criança
n
Mediana
P25
P75
p-valor
Perímetro braquial





Não obeso
57
19
17
22
0,753
Obeso
56
19
17
22


Passo 2: Se a variável categórica (varcateg) tiver mais de 2 classes, a comparação é entre mais de 2 médias.

# mais de 2 médias de distribuição normal - Análise de variância (ANOVA)
COMANDO DIGITADO: oneway varnum varcateg, tab bonferroni
Primeiro, observa-se o teste de Bartlett, que analisa a desigualdade das variâncias, pois, só se pode fazer ANOVA se as variâncias forem iguais, ou seja, se p > 0,05 (não-significante).

EXERCÍCIO 3 ____________________________________________________________________
Analisar se há diferença entre as médias das variáveis numéricas normais com o desfecho “obesidade_classe”, variável categórica com mais de 2 classes. Preencher a tabela.
COMANDO DIGITADO:
oneway idade obesidade_classe, tab bonferroni
ttest idade if obesidade_classe==0 | obesidade_classe==1, by( obesidade_classe)
ttest idade if obesidade_classe==1 | obesidade_classe==2, by( obesidade_classe)
O tab não mostra IC95% das médias, para isso faz-se o ttest para pares de categorias, um por vez, e mostra o valor de p para o par.

Tabela 3 – Variáveis normais com desfecho de três categorias:
Criança
n
Média
DP
IC95%
p-valor
Idade





Não obeso    
57
7,02
1,37
6,65-7,38

Obeso 1
32
6,44
1,32
5,96-6,91
0,148
Obeso 2
24
7,33
1,20
6,82-7,84
0,985


# mais de 2 médias de distribuição NÃO-normal - Kruskal-Wallis
COMANDO DIGITADO: kwallis varnum, by( varcateg)
Compara as medianas de amostras independentes.

EXERCÍCIO 4 ____________________________________________________________________
Analisar se há diferença entre as médias as medianas das variáveis numéricas não-normais com o desfecho “obesidade_classe”, variável categórica com mais de 2 classes. Preencher a tabela.
COMANDO DIGITADO:
kwallis perimetro_braquial, by( obesidade_classe)
bysort obesidade_classe: sum perimetro_braquial, d
Para mostrar os valores de mediana, P25, P75, pelas categorias da variável “obesidade_classe”.

Tabela 4 – Variáveis não-normais com desfecho de três categorias:
Criança
n
Mediana
P25
P75
p-valor
Perímetro braquial





Não obeso    
57
19
17
22
0,000
Obeso 1
32
18
16,5
19

Obeso 2
24
21
19,5
24,5


______________________________________________________
Para a análise com variável categórica, sugiro rever como categorizar uma variável numérica, pois pode ser necessário, ok! 

Nenhum comentário:

Postar um comentário