1 Sobre a Análise de Dados

A análise a ser apresentada é como se fosse a seção “Resultados” de um artigo no formato “Introdução,” “Método,” “Resultados”, “Discussão” e “Conclusão.” Caso queira, confira estes dois exemplos de artigos com essa estrutura: Arantes, P. & R. M. Lima Jr. (2021) e Teixeira, L. A. S. & R. M. Lima Jr. (2021).

A análise deve ser entregue em arquivo PDF.

1.1 Elementos obrigatórios na análise de dados:

A análise deve conter:

  1. Breve explicação sobre os dados, com as perguntas de pesquisa e hipóteses (estritamente referentes às variáveis preditoras utilizadas na análise)
  2. EDA – Exploratory Data Analysis
    • Pelo menos uma imagem (gráfico) apresentando os dados
    • Tabela com medidas de tendência central
    • Breve descrição dessas medidas e tendências dos dados
  3. Análise estatística/inferencial dos dados
    • Teste de hipótese ou modelo de regressão

A análise deve ser de apenas uma variável resposta e com pelo menos uma variável preditora (podem ser mais). Deve ser utilizado minimamente um teste de hipótese, mas idealmente um modelo de regressão. O modelo pode ser minimamente de apenas uma variável preditora, mas pode ser também um modelo múltiplo inclusive com efeitos mistos, tudo a depender do grau de segurança de cada um.

1.2 Quais dados utilizar

Os dados a serem utilizados podem ser:

  • vogalE da Livia Oushiro
  • covariaveis da Livia Oushiro
  • Qualquer dado do pacote languageR (Após carregar o pacote, rode data(package="languageR") para ver a lista com descrição dos dados disponíveis, ou acesse a documentação do pacote para ler sobre os conjuntos de dados). Algumas sugestões:
    • data(danish) - Auditory lexical decision latencies for Danish complex words.
    • data(dative) - Data describing the realization of the dative as NP or PP in the Switchboard corpus and the Treebank Wall Street Journal collection.
    • data(durationsGe) - Durational measurements on the Dutch prefix ge- in the Spoken Dutch Corpus.
    • data(durationsOnt) - Durational measurements on the Dutch prefix ont- in the Spoken Dutch Corpus.
    • data(etymology) - Estimated etymological age for regular and irregular monomorphemic Dutch verbs, together with other distributional predictors of regularity.
    • data(finalDevoicing) - Phonological specifications for onset, nucleus and offset for 1697 Dutch monomorphemic words with a final obstruent. These final obstruents may exhibit a voicing alternation that is traditionally described as syllable-final devoicing: underlying /d/ in /hond/ becomes a /t/ when syllable-final ([hOnt]) and remains a /d/ otherwise ([hOn-den]).
    • data(imaging) - Filtered fMRI signal at the most significant voxel and average priming scores for brain-damaged patients, in a study addressing the extent to which phonological and semantic processes recruit the same brain areas.
    • data(lexdec) - Lexical decision latencies elicited from 21 subjects for 79 English concrete (nouns, with variables linked to subject or word).
    • data(primingHeid) - Primed lexical decision latencies for Dutch neologisms ending in the suffix -heid.
    • data(regularity) - Regular and irregular Dutch verbs and selected lexical and distributional properties.
  • Qualquer outro dado que você tenha (sua pesquisa atual ou pesquisa anterior)
    • Atenção! Caso decida utilizar dados de pesquisa anterior, não copie seções da dissertação ou artigo, crie uma análise nos moldes aqui descritos.

A seguir demonstro um exemplo de uma análise mínima e de uma análise mais sofisticada dos mesmos dados, os dados vogaisPB, do Plinio Barbosa.

Observação: utilizei o seguinte comando para substituir as vogais E e O por seus símbolos fonéticos ɛ e ɔ:

remapping = c(i = "i", u = "u", a = "a", o = "o", e = "e", E = "ɛ", O = "ɔ")
pb$vogal = remapping[as.character(pb$vogal)]