2 Primeiro Exemplo

O primeiro exemplo é do mínimo que pode ser feito, utilizando um teste de hipótese como análise.

2.1 Explicação dos dados

Os dados utilizados nesta análise são dados das sete vogais orais tônicas do português do Brasil, coletadas por meio da gravação de palavras-alvo inseridas em frases-veículo lidas por um falante de São Paulo. As palavras eram dissílabas, paroxítonas, com a estrutura CV.CV; e a frase-guia utilizada foi “Digo palavra baixinho.” Há 234 observações, entre 11 e 43 observações para cada vogal, e as variáveis são ‘duração’ (em milissegundos) e valor do primeiro formante (F1, em Hertz). A Tabela 2.1 apresenta a quantidade de observações por vogal.

Table 2.1: Quantidade de observações por vogal
Vogal Observações
a 34
e 38
ɛ 27
i 38
o 11
ɔ 41
u 43

As perguntas de pesquisa são:

  1. Há efeito de duração sobre as vogais? Isto é, vogais diferentes apresentam durações diferentes?
  2. Há efeito de F1 sobre as vogais? Isto é, vogais diferentes apresentam valores de F1 diferentes?

As hiopóteses são:

  1. A altura das vogais é inversamente proporcional à duração, com vogais mais altas apresentam duração mais baixa e vice-versa.
  2. A altura das vogais é inversamente proporcional ao F1, com vogais mais altas apresentam F1 mais baixos e vice-versa.

2.2 Análise exploratória dos dados

A tabela 2.1 apresenta as médias, medianas e desvios-padrão da duração (em milissegundos) do primeiro formante (em Hertz) das vogais analisadas.

Figure 2.1: Dados descritivos: média, mediana e desvio-padrão da duração e de F1 por vogal

A menor média de duração foi da vogal /i/, com 87ms, seguida da vogal /u/, com média de 89ms. Esse resultado está alinhado com a literatura, já que vogais altas tendem a ser mais breves do que vogais baixas. A maior média de duração foi da vogal /o/ seguida da vogal /a/, com 119 e 111 milissegundos respectivamente.

O gráfico de caixas 2.2 e 2.3 a seguir apresenta as vogais em ordem crescente das medianas de duração.

Gráficos de caixas com duração por vogal

Figure 2.2: Gráficos de caixas com duração por vogal

Gráfico de caixas com valores de F1 por vogal

Figure 2.3: Gráfico de caixas com valores de F1 por vogal

O primeiro formante (F1) é um correlato acústico que correponde à altura da língua, com vogais mais altas exibindo valores menores de F1, e vogais mais baixas apresentando valores mais altos de F1. Os dados analisados apresentaram essa tendência, com as vogais altas /i/ e /u/ apresentando os menos valores de F1, e a vogal baixa /a/ apresentando os valores mais altos.

O gráfico 2.4 apresenta as vogais em função dos valores de F1, em ordem crescente dos valores de F1. Com a plotagem é possível verificar que há dois erros de medição no F1 da vogal /i/, umas vez que valores acima de 900 Hz para F1 não são possíveis. Sendo assim, esses dois dados foram excluídos de toda a análise que segue. O gréfico de caixas seguinte apresenta os dados sem esses dois dados.

Gráfico de caixas de F1 por vogal sem os dados extremos (erros de medição)

Figure 2.4: Gráfico de caixas de F1 por vogal sem os dados extremos (erros de medição)

2.3 Análise inferencial dos dados

Para a análise fora condiziadas duas análises de variância (ANOVA), uma com duraçã em função das vogais e outra com F1 em função das vogais.

A ANOVA da duração apresentou diferença significativa (\(f(6) = 4,5; p<0,001\)), o teste pareado pós-hoc (Tukey) apresentou difenreça entre /i/ e /o ɔ a/, e entre /u/ e /ɔ a/, ou seja, entre as duas vogais altas e, pelo menos, a baica e uma média-baixa. Sendo assim, nossa hipótese fica parcialmente confirmada.

A ANOVA da duração apresentou diferença significativa (\(f(6) = 501; p<0,001\)), o teste pareado pós-hoc (Tukey) apresentou difenreça entre todas as vogais, com exceção de /ɛ ɔ/ e /u i/, que são pares de mesma altura, médias-baixas e altas, respectivamente. Sendo assim, nossa hipótese fica totalmente confirmada.