From potential to practice
: evaluating AI grading models against human standards on Artificial Owl’s platform

Título traduzido da tese: Do potencial à prática: avaliação de modelos de classificação por IA face a padrões humanos na plataforma da Artificial Owl
  • Benjamin Holm Vogt (Aluno)

Tese do aluno: Dissertação de mestrado

Resumo

A inteligência artificial está a ganhar espaço na educação, mas o seu papel na avaliação continua controverso. Embora a automação prometa eficiência e consistência, subsistem dúvidas sobre se a IA consegue replicar os avaliadores humanos com precisão e justiça. Esta dissertação avalia o desempenho de três modelos de correção da plataforma Artificial Owl: Aditivo, Dedutivo e Torneio, aplicados a respostas do exame nacional de Português de 2024 (Prova 85). A análise incide sobre duas questões de resposta aberta com estruturas distintas: a Q7, uma tarefa curta e categórica com critérios rígidos, e a Q19, um ensaio com critérios multidimensionais. Os modelos foram comparados com classificações humanas através de correlação, erro absoluto médio e métricas de concordância. Os resultados revelam que os modelos absolutos, Aditivo e Dedutivo, se aproximaram mais das classificações humanas do que o modelo relativo de Torneio. A precisão foi superior na Q19 do que na Q7, sugerindo que respostas mais longas oferecem sinais mais ricos, enquanto tarefas de corte estrito expõem limitações da IA. De forma geral, a ordenação das respostas mostrou-se mais fiável do que a reprodução de notas exatas, sublinhando a importância das grelhas de correção e de uma lógica avaliativa semelhante à humana. O estudo posiciona a IA como ferramenta de apoio promissora, especialmente para ordenação e feedback formativo, e conclui com recomendações para sistemas híbridos humano-IA e para o desenvolvimento de uma plataforma colaborativa de correção pela Artificial Owl.
Data de atribuição15 out. 2025
Idioma originalEnglish
Instituição de premiação
  • Universidade Católica Portuguesa
SupervisorRute Xavier (Supervisor)

ODS da ONU

Esta tese de estudante contribui para os seguintes Objetivos de Desenvolvimento Sustentável (ODS) da ONU

  1. ODS 4 - Educação de qualidade
    ODS 4 Educação de qualidade
  2. ODS 9 - Indústria, inovação e infraestrutura
    ODS 9 Indústria, inovação e infraestrutura
  3. ODS 10 - Desigualdades reduzidas
    ODS 10 Desigualdades reduzidas

Keywords

  • Inteligência artificial
  • Correção automática de provas (CAP)
  • Precisão da avaliação
  • Modelos de avaliação
  • Sistemas híbridos
  • Exame nacional de português

Designação

  • Mestrado em Gestão e Administração de Empresas (mestrado internacional)

Citação

'