domingo, 19 de setembro de 2010

Mais sobre variáveis

Selecionando a estatística apropriada
 Segundo os autores, a maioria dos pesquisadores iniciantes enfrentam sérias dificuldades quando tem de usar a análise estatística. Eles apontam como prováveis causas o ensino de Estatística que, frequentemente, tem um enfoque matemático ou de livro de culinária que não conduzem  ao aproveitamento desta ferramenta e, a ansiedade matemática, que pode levar os estudantes a evitar o uso de números e a não confiança na área. Essa situação conduz muitos  estudantes a dependência de outros para selecionar a estatística adequada a seu projeto. O objetivo deste capítulo é ajudar a ter uma idéia da potencialidade da estatística apropriada a sua pesquisa.
 Primeiro examine seu estudo
 Como primeiro passo na escolha da estatística apropriada, identifique o propósito que você quer com sua análise estatística. Inicialmente você deve especificar claramente as várias questões que você quer que sua análise estatística responda. Comece com suas questões de pesquisa e hipóteses. Porém, você precisa ir além disso, pois usará a Estatística para mais do que testar sua hipótese.
 Suponha que desejamos saber como as atitudes em relação à Matemática interferem na formação das atitudes em relação à Estatística e o impacto dessas atitudes no desempenho na disciplina de Estatística, além da interferência de outras variáveis. A Figura 1 esquematiza as variáveis, a relação entre elas e as hipóteses.

A seguir, faça uma lista de cada variável que você pretende analisar. Se você está olhando as características demográficas de sua amostra, liste cada peça de dados demográficos e determine como você pegará os dados para cada sujeito em cada variável. Faça a mesma coisa para suas variáveis dependentes e independentes. No nosso exemplo:
  Tabela 1. Lista das variáveis a serem pesquisadas e suas características
Construtos / variáveis
Instrumento
Variáveis
Natureza (1)
Valores / níveis ou categorias
Desempenho em
Estatística (2)
Registros
 acadêmicos
Nota final
Dependente
Quantitativa – contínua
De 0 a 10
Atitudes em relação à Estatística
Escala do tipo
Likert de 20 itens
Pontuação na escala
Dependente
Quantitativa – contínua
De 20 a 80 pontos
Atitudes em relação à Matemática
Escala do tipo
Likert de 20 itens
Pontuação na escala
Independente
Quantitativa – contínua
De 20 a 80 pontos
Área de conhecimento
do curso
Questionário
Área
Independente
Qualitativa nominal
Exatas, Humanas, Biológicas
Turno do curso
Questionário
Turno
Independente
Qualitativa nominal
Diurno, Matutino, Vespertino, Noturno
Gênero
Questionário
Gênero
Independente
Qualitativa nominal
Masculino
Feminino
Idade (3)
Questionário
Faixa etária
Independente
Qualitativa ordinal
Até 18; de 19 a 21; de 22 a 24, + 25
Renda Familiar (4)
Questionário
Faixa de renda
Independente
Qualitativa ordinal
Até 5, de 5 a 10, de 10 a 20, mais de 20
Nº de disciplinas de Matemática cursadas (5)
Histórico escolar
do aluno
Número_mat
Independente
Qualitativa ordinal
Nenhuma, uma,
duas ou mais
Curso no 2º grau
Questionário
Curso_2ºgrau
Independente
Qualitativa nominal
Científico, Técnico, Magistério
Pontuação no vestibular geral (6)
Registro acadêmico
Vestibular_total
Independente
Quantitativa – contínua
0 a 100
Pontuação no vestibular
em Matemática (6)
Registro acadêmico
Vestibular_mat
Independente
Quantitativa – contínua
0 a 100
Auto-percepção de desempenho em Matemática
Questionário
Auto-percepção
Matemática
Independente
Qualitativa ordinal
Péssimo, ruim,
bom, muito bom
Nº de disciplinas de Estatística cursadas (5)
Histórico escolar
do aluno
Número_est
Independente
Qualitativa ordinal
Nenhuma, uma,
duas ou mais
Reprovação em
Estatística (7)
Histórico escolar
do aluno
Reprovação
Independente
Qualitativa nominal
Reprovou, não, cursando 1ª vez
Auto-percepção de desempenho em Estatística
Questionário
Auto-percepção
Estatística
Independente
Qualitativa ordinal
Péssimo, ruim,
bom, muito bom
(1)     As variáveis, de acordo a sua natureza se classificam em quantitativas (discretas e contínuas) e qualitativas ou categóricas (nominal e ordinal); de acordo a sua função em variáveis dependentes (VD) e independentes (VI).
(2)     Você pode elaborar um instrumento para avaliar o desempenho.
(3)     A idade pode ser definida como contínua se perguntarmos a data de nascimento e calcularmos a idade exata, com frações de anos; como discreta, se perguntarmos a idade em anos completos, e qualitativa ordinal, se fixarmos faixas, como, por exemplo, menos de 18 anos; de 19 a 21; de 22 a 24, e 25 anos ou mais.
(4)     A renda familiar, idem a variável idade: contínua (valor exato); discreta (número de salários mínimos completos); ordinal (faixas de renda).
(5)     Via de regra, este tipo de variável toma poucos valores, logo pode ser definida como ordinal: nenhuma, uma, duas ou mais.
(6)     Depende da Universidade, via de regra a pontuação é padronizada. Outra forma de mensurar esta variável é o posto que o aluno ocupou no vestibular.
(7)     Você pode definir como qualitativa nominal: reprovou, não reprovou, cursando pela primeira vez.
Sugestão: se possível, pegue o dado bruto, depois via SPSS agrupe, isto lhe dará flexibilidade para diversos agrupamentos. Se você não conhece a definição dos termos estatísticos procure o GLOSSÁRIO em anexo.
Não se preocupe se você fica confuso. Confusão pode ser sinal que você precisa clarear exatamente como cada medida gerará um dado. Tire uma cópia de cada instrumento, simule dados para poucos sujeitos, registre os dados e examine os resultados. No final desse processo, você terá uma lista de questões que você tenta responder com Estatística e uma segunda lista de variáveis que aquelas estatísticas usaram de uma ou de outra maneira.
Observe que algumas variáveis serão coletadas por instrumentos, alguns já elaborados e validados, tais como a escala de atitudes, outros você elaborará. Se você opta por construir o instrumento (por exemplo, uma prova para avaliar o desempenho), lembre-se de validar o instrumento.
A seguir, escolha uma das questões que você tenta responder com Estatística. Indique as variáveis independentes e dependente(categorias ou valores) específicas envolvidas na resposta desta questão. Por exemplo, se a questão fosse: “a área de conhecimento do curso e gênero interferem na formação de atitudes em relação à Estatística”. Você deve listar a variável gênero (Masculino, Feminino) e variável área de conhecimento (Exatas, Humanas, Biológicas) como variáveis independentes e a pontuação na escala como variável dependente. Então, pergunte a sim mesmo:
(a)    esta questão será respondida comparando grupos de sujeitos? ou,
(b)   esta questão será respondida relacionando a pontuação das diferentes variáveis a uma outra em um único grupo de sujeitos?
 Neste caso, a primeira alternativa é a correta. Você precisa comparar pontuações entre vários grupos. As estatísticas que comparam grupos são os delineamentos experimentais e quase-experimentais, que comparam entre grupos, dentro de grupos, e mistos. Note que uma comparação estatística de grupos pode ser apropriada se você está comparando  ou (a) as pontuações de diferentes grupos de indivíduos (Masculino, Feminino) ou (b) as pontuações do mesmo grupo de indivíduos que tem sido registrados em diferentes pontos no tempo (pré-teste e pós-teste) ou sobre diferentes condições.
No nosso exemplo:

Hipótese: existe diferença significativa
 Os delineamentos que requerem estatísticas de comparação de grupos usa variáveis independentes que o pesquisador define de forma que os sujeitos se encaixem em grupos, onde cada grupo é chamado de nível e tem seu rótulo, chamadas de variáveis qualitativas ou categóricas. No nosso exemplo: Gênero (Masculino e Feminino), área de conhecimento (Exatas, Humanas e Biológicas). Se o pesquisador não está interessado nas diferenças por gênero, esta não deve ser considerada como variável independente e o pesquisador não tem porque examiná-la.
Se você deseja tratar seus sujeitos como um único grupo e examinar associações entre pontuações, um delineamento correlacional pode ser mais apropriado. Este será o caso se a questão de pesquisa for “qual a relação entre as atitudes em relação à Estatística (medido pela somatória de pontos obtidos nos 20 itens da escala de atitudes), as atitudes em relação à Matemática (similar a anterior) e o desempenho em Estatística (mensurado como a nota final na disciplina)?” Esta pesquisa trata todos os sujeitos como um simples grupo. Eles não estão sorteados em grupos separados. Nos estudos correlacionais  as variáveis podem ser contínuas ou discretas, embora é mais freqüente serem contínuas. Nos procuramos por estatísticas correlacionais para responder questões de tipos de associação ou derelação. Neste caso usaremos as técnicas de correlação e de regressão
Variável independente
Quantitativa
(covariável)

Variável dependente
Quantitativa

Variável dependente
Quantitativa
Atitudes em relação à matemática
  ----->
Atitudes em relação
à Estatística
  <---->
Desempenho
em Estatística
 
Um outro exemplo: suponha que você está interessado  em saber se crianças com alto coeficiente de inteligência (QI) experimentam mais problemas com seus pais do que crianças sem alto QI. Você pode delinear seu estudo de duas formas: (a) coletar a pontuação do QI e da interação com os pais e examinar a relação entre eles, ou (b) sortear crianças em grupos de QI, com dois ou mais níveis (pe. alto e médio QI) e olhar a diferença entre os grupos na interação com seus pais, usando uma comparação de grupos.

QI medido com testes apropriados
Interação com os pais (quantitativa), medido com um instrumento similar a escala de atitudes.
Via de regra, delineamentos correlacionais são mais apropriados quando você conceitua sua variável independente como contínua (pe. inteligência, pontuação na escala de atitudes, nota numa prova) ou se você deseja  examinar as melhores combinações de variáveis independentes para prever uma única variável dependente. Também, é adequado quando você não consegue manipular as variáveis independentes (você não pode manipular, inteligência, atitudes, etc.). De outro lado, se você transformar uma variável contínua em grupos e usar estatísticas de comparação, seus resultados perdem poder estatístico.
Delineamento de comparação de grupos são mais apropriados que os delineamentos correlacionais quando a variável independente é naturalmente categorizada (por exemplo, gênero, tipo de escola, área de conhecimento), ou baseada em variáveis combinadas, em um forma não linear (por exemplo, diagnóstico psiquiátrico,  os quais estão baseados na presença, ausência ou degraus de vários comportamentos). Comparação de grupos, também, são mais apropriados quando você manipula as variáveis independentes (por exemplo tratamento versus controle).
Como segundo passo na escolha da estatística apropriada, cheque se sua variável dependente é adequada para a estatística paramétrica. A estatística paramétrica envolve dois pressupostos, subjacentes a distribuição dos escores na população, onde você está amostrando. O primeiro é que esses escores seguem uma distribuição normal e, o segundo, é que os dados entre diferentes sujeitos sãoindependentes. Outros testes paramétricos tem requerimentos adicionais. Portanto, uma variável qualitativa ou categórica não se enquadra neste tipo de estatística, devendo usar o enfoque da estatística não paramétrica.
Assim recorremos a estatística paramétrica quando analisamos variáveis dependentes contínuas. Se essas variáveis violam os pressupostos e não tem como corrigir essa violação, então você deve utilizar a estatística não paramétrica.
Examine cada variável dependente uma por uma nesse processo. Nem todas terão as mesmas características. Um erro comum, por exemplo, é assumir que você pode usar o mesmo teste estatístico  se os grupos experimentais são equivalente em idade, gênero, anos de estudos e outras variáveis demográficas. Idade e anos de estudo são duas variáveis geralmente analisadas com estatística paramétrica. Gênero e etnia são variáveis categóricas e por isto devem ser analisadas com Estatística não paramétrica.
Você poderá usar diferentes estatísticas.
Neste ponto, você tem uma lista de questões que você usará estatística para responder.  Você tem uma lista de variáveis dependentes e variáveis independentes. Para cada variável dependente você indicará se um teste paramétrico é adequado ou não. Finalmente, você indicará se a questão envolve análise comparando grupos (estatísticas de comparação de grupos) ou relacionando escores de uma ou mais medidas em um único grupo (estatística  correlacional).
No nosso exemplo, a variável dependente pode ser tanto as atitudes em relação à Estatística, quanto as notas na disciplina. Via de regra, a pontuação na escala de atitudes segue uma distribuição normal, já as notas, nem sempre. Você tem duas opções: uma aprender a lidar com a Estatística não paramétrica, a outra, aumentar o tamanho da amostra.
Supondo que suas variáveis dependentes tivessem uma distribuição normal ou que sua amostra fosse suficientemente grande, você deve verificar todas as possibilidades de análise: univariada , bivariada, múltipla e multivariada, se for o caso. A Tabela 2 mostra o planeamento para análise univariada e bivariada. Numa primeira triagem você deve rodar todas as análises, colocar os resultados de forma sintética e depois explorar aquelas que apresentaram resultados interessantes. Lembre-se que não encontrar os resultados esperados, também pode ser interessante. Faça uma análise cuidadosa dos resultados.
     A análise univariada é quando a variável é analisada per se, análise bivariada quando uma variável dependente é relacionada com uma única variável independente, análise múltipla quando se analisa uma variável dependente em função de várias variáveis independentes, e análise multivariada, quando se analisa várias variáveis dependentes contínuas em função de variáveis independentes categóricas ou quando se analisa a estrutura das variáveis, visando a redução do número de variáveis.
Se a variável dependente for categórica e você deseja saber, por exemplo, se esta se relaciona com uma variável independente categórica, você deverá utilizar o teste Qui-quadrado. Por exemplo, se você quer saber se a escolha do curso (área de conhecimento) está relacionada ao Gênero, ou se as mulheres tendem a ter uma auto-percepção de desempenho em Estatística  menos positiva do que os homens. A Tabela 3 e as Figuras 2 e 3 complementam o esquema de análise.

Tabela 2. Planejamento das análises estatísticas univariadas e bivariadas das variáveis



Variáveis
Análise univariada

Análise bivariada
Variável dependente: Nota final (*)
Estatísticas
Gráficos
Apropriados

Estatísticas
Gráficos
apropriados
Nota final
n, média, dp
Histograma, ramo e folhas ou box-plot



Pont. na escala estatística
n, média, dp
Histograma, ramo e folhas ou box-plot

Correlação bivariada
 regressão simples
Scatter plot
Pont. na escala matemática
n, média, dp
Histograma, ramo e folhas ou box-plot

Correlação bivariada
Regressão simples
Scatter plot
Área
TDF
Barras

ANOVA – Teste F
box-plot
Turno
TDF
Barras

ANOVA – Teste F
box-plot
Gênero
TDF
Barras

Teste t-student
box-plot
Faixa etária
TDF
Barras

ANOVA – Teste F
box-plot
Faixa de renda
TDF
Barras

ANOVA – Teste F
box-plot
Número_mat
TDF
Barras

ANOVA – Teste F
box-plot
Curso_2ºgrau
TDF
Barras

ANOVA – Teste F
box-plot
Vestibular_total
n, média, dp
Histograma, ramo e folhas ou box-plot

Correlação bivariada regressão simples
Scatter plot
Vestibular_mat
n, média, dp
Histograma, ramo e folhas ou box-plot

Correlação bivariada regressão simples
Scatter plot
Auto-percepção Matemática
TDF
Barras

ANOVA – Teste F
box-plot
Número_est
TDF
Barras

ANOVA – Teste F
box-plot
Reprovação
TDF
Barras

ANOVA – Teste F
box-plot
Auto-percepção Estatística
TDF
Barras

ANOVA – Teste F
box-plot
TDF= Tabela de distribuição de frequências (use a opção frequencies do SPSS);
 
n = tamanho da amostra
dp = desvio padrão;
(*) o mesmo esquema pode ser utilizado para a variável atitudes em relação à Estatística

Tabela 3. Exemplo dos principais testes estatísticos

Variável Dependente
(VD)
Variável independente
(VI)
Teste estatístico
Hipótese nula (Ho)
O que está sendo testado pelo SPSS
Hipótese alternativa (H1)
O que você quer mostrar
Nota em estatística
(quantitativa)
Gênero
(categórica)
Masculino, Feminino
Comparação de grupos
t-student (amostras independentes)
Não existe diferença significativa na nota média de homens e mulheres
Ho1= m 2
existe diferença significativa na nota média de homens e mulheres
H1¹ m 2
Pontuação na escala de atitudes Estatística
(quantitativa)
Área de conhecimento (categórica)
Exatas, Humanas, Biológicas
Comparação de grupos
ANOVA 1 fator
Teste F
Não existe diferença significativa
 na pontuação média entre áreas
Ho1= m 2= m 3
existe pelo menos uma diferença sig.
 na pontuação média entre áreas:
H1mi  ¹  mj
Pontuação na escala de atitudes Estatística
(quantitativa)
Área de conhecimento:  Exatas, Humanas, Biológicas
Gênero: Masculino, Feminino (ambas categóricas)
Comparação de grupos
ANOVA 2 fatores
sem interação (Blocos)
Teste F
Não existe diferença signifi-
cativa na pontuação média
      entre áreas:       Hom1= m2= m3.
      entre gêneros:   Hom.1= m.2
Existe diferença signifi-
cativa na pontuação média
         entre áreas:       H1mi.  ¹  mj.
entre gêneros:   H1m.¹  m.2
Nota em estatística (Y)
(quantitativa)
Pontuação na escala
de atitudes Estatística (X)
(quantitativa)
Correlação linear
Coeficiente de correlação de Pearson (Spearman)
Não existe relação entre a Nota
em estatística (Y) e Pontuação na
Escala de atitudes Estatística (X)
Hoxy = 0
A nota em estatística e influenciada
 pela pontuação na escala
de atitudes Estatística:
H1r xy  ¹ 0
Nota em estatística (Y)
(quantitativa)
Pontuação na escala
de atitudes Estatística (X)
(quantitativa)
Regressão linear simples
A nota em estatística (Y) não
pode ser expressa como uma
função linear da pontuação na
escala de atitudes Estatística (X)
Ho: Y ¹  a + b*X
A nota em estatística pode
ser expressa como uma
função linear da pontuação na
escala de atitudes Estatística
H1: Y = a + b*X
Nota em estatística (Y)
(quantitativa)
Atitudes Matemática    (X1)
Atitudes Estatística      (X2)
Vestibular geral            (X3)
Vestibular Matemática (X4)
(todas quantitativas)
Regressão linear múltipla
A nota em estatística não pode ser expressa como uma função linear
das variáveis independentes
Ho: Y ¹  a + b*X1+ c*X2+ d*X3+ e*X4
A nota em estatística  pode ser
Expressa como uma função linear
das variáveis independentes
H1: Y =  a + b*X1+ c*X2+ d*X3+ e*X4
Nota em estatística (Y)
(quantitativa)
Atitudes Estatística   (X)
(quantitativas – covariável)
Área de conhecimento (Z)
(categórica): Ex., Hum., Bio
Análise de Covariância
ANCOVA
A nota em estatística não pode ser expressa como uma função linear
das variáveis independentes
Ho: Y ¹  a + b*X+ c*Z
A nota em estatística pode ser
Expressa como uma função linear
das variáveis independentes
H1: Y =  a + b*X+ c*Z
Auto-percepção de desempenho em Estatística (Y) (categórica): Péssimo, ruim, bom, muito bom










Gênero (X)
(categórica)
Masculino, Feminino
Qui-quadrado
c2
Não existe relação entre a Auto-percepção de desempenho
em Estatística e o gênero
Ho: Y não depende de X
Existe relação entre a Auto-
Percepção de desempenho
em Estatística e o gênero
H1: Y depende de X











Nenhum comentário:

Postar um comentário