Exemplo de Análise de Dados para Avaliação
2021-11-29
1 Sobre a Análise de Dados
A análise a ser apresentada é como se fosse a seção “Resultados” de um artigo no formato “Introdução,” “Método,” “Resultados”, “Discussão” e “Conclusão.” Caso queira, confira estes dois exemplos de artigos com essa estrutura: Arantes, P. & R. M. Lima Jr. (2021) e Teixeira, L. A. S. & R. M. Lima Jr. (2021).
A análise deve ser entregue em arquivo PDF.
1.1 Elementos obrigatórios na análise de dados:
A análise deve conter:
- Breve explicação sobre os dados, com as perguntas de pesquisa e hipóteses (estritamente referentes às variáveis preditoras utilizadas na análise)
- EDA – Exploratory Data Analysis
- Pelo menos uma imagem (gráfico) apresentando os dados
- Tabela com medidas de tendência central
- Breve descrição dessas medidas e tendências dos dados
- Análise estatística/inferencial dos dados
- Teste de hipótese ou modelo de regressão
A análise deve ser de apenas uma variável resposta e com pelo menos uma variável preditora (podem ser mais). Deve ser utilizado minimamente um teste de hipótese, mas idealmente um modelo de regressão. O modelo pode ser minimamente de apenas uma variável preditora, mas pode ser também um modelo múltiplo inclusive com efeitos mistos, tudo a depender do grau de segurança de cada um.
1.2 Quais dados utilizar
Os dados a serem utilizados podem ser:
vogalE
da Livia Oushirocovariaveis
da Livia Oushiro- Qualquer dado do pacote
languageR
(Após carregar o pacote, rodedata(package="languageR")
para ver a lista com descrição dos dados disponíveis, ou acesse a documentação do pacote para ler sobre os conjuntos de dados). Algumas sugestões:data(danish)
- Auditory lexical decision latencies for Danish complex words.data(dative)
- Data describing the realization of the dative as NP or PP in the Switchboard corpus and the Treebank Wall Street Journal collection.data(durationsGe)
- Durational measurements on the Dutch prefix ge- in the Spoken Dutch Corpus.data(durationsOnt)
- Durational measurements on the Dutch prefix ont- in the Spoken Dutch Corpus.data(etymology)
- Estimated etymological age for regular and irregular monomorphemic Dutch verbs, together with other distributional predictors of regularity.data(finalDevoicing)
- Phonological specifications for onset, nucleus and offset for 1697 Dutch monomorphemic words with a final obstruent. These final obstruents may exhibit a voicing alternation that is traditionally described as syllable-final devoicing: underlying /d/ in /hond/ becomes a /t/ when syllable-final ([hOnt]) and remains a /d/ otherwise ([hOn-den]).data(imaging)
- Filtered fMRI signal at the most significant voxel and average priming scores for brain-damaged patients, in a study addressing the extent to which phonological and semantic processes recruit the same brain areas.data(lexdec)
- Lexical decision latencies elicited from 21 subjects for 79 English concrete (nouns, with variables linked to subject or word).data(primingHeid)
- Primed lexical decision latencies for Dutch neologisms ending in the suffix -heid.data(regularity)
- Regular and irregular Dutch verbs and selected lexical and distributional properties.
- Qualquer outro dado que você tenha (sua pesquisa atual ou pesquisa anterior)
- Atenção! Caso decida utilizar dados de pesquisa anterior, não copie seções da dissertação ou artigo, crie uma análise nos moldes aqui descritos.
A seguir demonstro um exemplo de uma análise mínima e de uma análise mais sofisticada dos mesmos dados, os dados vogaisPB
, do Plinio Barbosa.
Observação: utilizei o seguinte comando para substituir as vogais E
e O
por seus símbolos fonéticos ɛ
e ɔ
:
= c(i = "i", u = "u", a = "a", o = "o", e = "e", E = "ɛ", O = "ɔ")
remapping $vogal = remapping[as.character(pb$vogal)] pb