O presente estudo tem como objetivo explorar a aplicabilidade de modelos dediferen¸cas temporais na previs˜ao de dados de s´eries temporais. Em primeiro lu gar, ´e fornecida uma vis˜ao geral dos principais conceitos da Programa¸c˜ao DinˆamicaAproximada, a come¸car pelos conceitos fundamentais da programa¸c˜ao dinˆamica eindo at´e `a arquitetura da aprendizagem de refor¸co. Segue-se uma breve descri¸c˜aode trabalhos complementares que abordam temas relacionados, onde s˜ao revela dos resultados valiosos e interessantes de outros autores. Os m´etodos utilizadosnesta an´alise s˜ao algoritmos de diferen¸cas temporais, em particular TD(0), TD(λ)e GTD2. A fim de avaliar a viabilidade destes modelos aplicados a s´eries tempo rais, o seu desempenho quando aplicados a m´etricas econ´omicas - produto internobruto, consumo privado, investimento e exporta¸c˜oes em Portugal - s˜ao diretamentecomparados com a performance de um filtro Hodrick-Prescott e um modelo Auto Regressivo, que foram desenvolvidos para fins de benchmarking. A performancedos modelos foi avaliada atrav´es da an´alise de trˆes m´etricas, o erro m´edio abso luto, o erro quadr´atico m´edio e a ra´ız do erro quadr´atico m´edio. Ao comparar odesempenho dos modelos de referˆencia e dos modelos propostos, observa-se que osmodelos de diferen¸cas temporais fornecem previs˜oes de maior qualidade, provandoser ferramentas eficazes na previs˜ao de s´eries temporais.
| Data de atribuição | 5 jul. 2023 |
|---|
| Idioma original | English |
|---|
| Instituição de premiação | - Universidade Católica Portuguesa
|
|---|
| Supervisor | Pedro Afonso Fernandes (Supervisor) |
|---|
- Programação dinâmica aproximada
- Aprendizagem de reforço
- Programação dinâmica
- Processos de decisão de Markov
- Previsão económica
- Métodos de diferenças temporais
- Mestrado em Análise de Dados para Gestão
Ensemble reinforcement learning to forecast time series data: a performance analysis
Madureira, Z. A. A. (Aluno). 5 jul. 2023
Tese do aluno: Dissertação de mestrado