Esta tese, ao debruçarse sobre o sistema de partilha de bicicletas em Chicago, pretende contribuir para a implementação de modelos que permitem analisar, com rigor, a procura por hora de bicicletas partilhadas, utilizando componentes temporais e climatéricas.A variável dependente é o Count, que representa o somatório do número de bicicletas utilizadas por hora. Os modelos preditivos utilizados neste problema de regressão são: Linear Regression, Random Forest, Gradient Boosting, Light Gradient Boosting, Extreme Gradient Boosting, e MultiLayer Perceptron. A precisão destes modelos é medida através do R2_score, Root Mean Square Error e Mean Absolute Error. No intuito de minimizar o grau de erro são utilizados vários hiperparâmetros para os diferentes modelos preditivos.Sem hiperparâmetros, o Random Forest alcança as melhores previsões. Contudo, após a utilização de hiperparâmetros, o Gradient Boosting prevê resultados mais precisos.A precisão do Gradient Boosting aumenta com a utilização de hiperparâmetros, enquanto que o Random Forest não é afetado por eles, de modo significativo.O segundo melhor modelo ao utilizar hiperparâmetros é o Extreme Gradient Boosting. O modelo de rede neural MultiLayer Perceptron, apresenta resultados menos precisos do que o Random Forest e os modelos de Boosting.As características mais importantes para que os modelos preditivos revelem maior exatidão foram: Temperature, Hour, Weekend, Pressure, Uv_Index, e Day.
Data do prémio | 3 fev. 2023 |
---|
Idioma original | English |
---|
Instituição de premiação | - Universidade Católica Portuguesa
|
---|
Supervisor | Nicolò Bertani (Supervisor) |
---|
- Procura
- Bicicletas partilhadas
- Dados meteorológicos
- Aprendizado de máquina
- Modelos preditivos
- Mestrado em Análise de Dados para Gestão
Predicting hourly demand for shared bicycles with weather data and machine learning models
Peja, D. (Aluno). 3 fev. 2023
Tese do aluno