Utilize este identificador para referenciar este registo:
https://hdl.handle.net/1822/55163
Título: | Forecasting na previsão da incidência de pneumonia em Portugal Continental |
Autor(es): | Veloso, Sara Isabel Ferreira |
Orientador(es): | Santos, Maribel Yasmina |
Palavras-chave: | Time-series forecasting Data mining Séries temporais Modelos preditivos Time-series Predictive models |
Data: | 2017 |
Resumo(s): | A incidência de pneumonia tem vindo a aumentar na última década e, em Portugal, é a principal causa de morte e de internamentos hospitalares, representando um sério problema para o qual é necessário um estudo mais aprofundado de forma a obter novos conhecimentos e perceções sobre este fenómeno. É neste sentido que a Fundação Portuguesa do Pulmão em parceria com a Universidade do Minho tem vindo a desenvolver vários estudos, com o objetivo de caraterizar a população Portuguesa no que diz respeito a doenças respiratórias. O trabalho a realizar nesta dissertação de mestrado surge com o objetivo de dar seguimento aos estudos já realizados através da aplicação de técnicas de time-series forecasting para a previsão deste fenómeno, nomeadamente, o número de casos de pneumonias e vítimas mortais em Portugal Continental, onde foram utilizados algoritmos de Data Mining para identificar modelos preditivos. Este conhecimento poderá ser útil para uma tomada de decisão mais eficaz, por parte da Fundação Portuguesa do Pulmão, ao possibilitar a identificação de padrões temporais sobre a doença. Numa primeira parte, o trabalho resultou na realização de um enquadramento conceptual, baseado em literatura relevante, acerca de conceitos associados ao Data Mining, dando relevância ao conceito e técnicas de forecasting e algoritmos disponíveis que podem ser aplicados em contextos de séries temporais. Apesar de existir uma grande variedade de literatura sobre a aplicação de técnicas de Data Mining em contextos de previsão, quando se fala sobre previsão de séries temporais a informação é mais limitada. Além disso, apesar de existirem alguns de trabalhos realizados neste contexto, não são percetíveis na literatura, trabalhos relacionados com a previsão de fenómenos associados à pneumonia. Posto isto, o trabalho prosseguiu com a aplicação de metodologia CRISP-DM para a determinação de modelos preditivos para a série do número de casos de pneumonias e para a série do número de vítimas mortais. Primeiramente foi realizada uma caracterização dos dados, numa perspetiva temporal, para tentar identificar relações destas séries com outras variáveis incluídas no Data Warehouse, de onde resultou a identificação de algumas relações com outras variáveis. Tendo em conta esta informação, foram testados vários algoritmos com diferentes condições de teste e, posteriormente, foram comparados e avaliados de acordo com a precisão dos mesmos. Daqui foi possível identificar um modelo preditivo, para cada uma das séries, capaz de prever os respetivos fenómenos com elevado desempenho e os quais podem ser utilizados para fazer inferências sobre outras variáveis com as quais são visíveis padrões de relacionamento. The incidence of pneumonia has been increasing in the last decade and in Portugal is a leading cause of death and hospital admissions, representing a serious problem for which further study is needed in order to obtain new knowledge and perceptions about this phenomenon. It is in this sense that the Fundação Portuguesa do Pulmão in partnership with the Universidade do Minho has been developing several studies aiming to characterize the Portuguese population with respect to respiratory diseases. The work to be carried out in this master's thesis arises with the objective of following up the studies already carried out by applying time-series forecasting techniques to predict this phenomenon, namely the number of cases of pneumonia and fatalities in Portugal where Data Mining algorithms were used to identify predictive models. This knowledge may be useful for a more effective decision making by the Fundação Portuguesa do Pulmão by enabling the identification of temporal patterns of the disease. In the first part, the work resulted in the realization of a conceptual framework, based on relevant literature, about concepts associated with Data Mining giving relevance to the concept and forecasting techniques and available algorithms that can be applied in time series contexts. Although there is a wide variety of literature on the application of Data Mining techniques in prediction contexts when we talk about time series prediction the information is more limited. In addition, although there are some studies carried out in this context, studies related to the prediction of phenomena associated with pneumonia are not perceptible in the literature. After this, the work continued with the application of CRISP-DM methodology for the determination of predictive models for the series of the number of cases of pneumonia and for the series of the number of fatalities. Firstly, a data characterization was carried out in a temporal perspective to try identify relations of these series with other variables included in the Data Warehouse from which resulted the identification of some relations with other variables. Considering this information, several algorithms with different test conditions were tested and subsequently compared and evaluated according to their accuracy. From this it was possible to identify a predictive model, for each of the series, able to predict the respective phenomena with high performance and which can be used to make inferences about other variables with which patterns of relationship are visible. |
Tipo: | Dissertação de mestrado |
Descrição: | Dissertação de mestrado em Sistemas de Informação |
URI: | https://hdl.handle.net/1822/55163 |
Acesso: | Acesso restrito UMinho |
Aparece nas coleções: | BUM - Dissertações de Mestrado DSI - Engenharia e Gestão de Sistemas de Informação |
Ficheiros deste registo:
Ficheiro | Descrição | Tamanho | Formato | |
---|---|---|---|---|
MSI_SaraVeloso_PG26532_Repositorium.pdf Acesso restrito! | 6,04 MB | Adobe PDF | Ver/Abrir |