Predicting hourly demand for shared bicycles with weather data and machine learning models

  • Dijora Peja (Aluno)

Tese do aluno

Resumo

Esta tese, ao debruçar­se sobre o sistema de partilha de bicicletas em Chicago, pretende contribuir para a implementação de modelos que permitem analisar, com rigor, a procura por hora de bicicletas partilhadas, utilizando componentes temporais e climatéricas.A variável dependente é o Count, que representa o somatório do número de bicicletas utilizadas por hora. Os modelos preditivos utilizados neste problema de regressão são: Linear Regression, Random Forest, Gradient Boosting, Light Gradient Boosting, Extreme Gradient Boosting, e MultiLayer Perceptron. A precisão destes modelos é medida através do R2_score, Root Mean Square Error e Mean Absolute Error. No intuito de minimizar o grau de erro são utilizados vários hiperparâmetros para os diferentes modelos preditivos.Sem hiperparâmetros, o Random Forest alcança as melhores previsões. Contudo, após a utilização de hiperparâmetros, o Gradient Boosting prevê resultados mais precisos.A precisão do Gradient Boosting aumenta com a utilização de hiperparâmetros, enquanto que o Random Forest não é afetado por eles, de modo significativo.O segundo melhor modelo ao utilizar hiperparâmetros é o Extreme Gradient Boosting. O modelo de rede neural Multi­Layer Perceptron, apresenta resultados menos precisos do que o Random Forest e os modelos de Boosting.As características mais importantes para que os modelos preditivos revelem maior exatidão foram: Temperature, Hour, Weekend, Pressure, Uv_Index, e Day.
Data do prémio3 fev. 2023
Idioma originalEnglish
Instituição de premiação
  • Universidade Católica Portuguesa
SupervisorNicolò Bertani (Supervisor)

Keywords

  • Procura
  • Bicicletas partilhadas
  • Dados meteorológicos
  • Aprendizado de máquina
  • Modelos preditivos

Designação

  • Mestrado em Análise de Dados para Gestão

Citação

'