Utilize este identificador para referenciar este registo:
https://hdl.handle.net/1822/29402
Título: | Modelos para dados de contagem com excesso de zeros |
Autor(es): | Santos, Jorge Helder Pereira dos |
Orientador(es): | Faria, Susana |
Palavras-chave: | Modelo de regressão de Poisson Modelo de regressão binomial negativa Modelo de regressão de zeros inflacionados Poisson regression Negative binomial regression Zero inflated model |
Data: | 2013 |
Resumo(s): | Os modelos de regressão para dados de contagem são muito utilizados nas mais variadas áreas de estudo para a modelação de fenómenos. Estes modelos integram um quadro
especial de metodologias devido ao facto de a variável resposta tomar apenas valores inteiros
não negativos. A distribuição de Poisson é a mais conhecida, e a mais utilizada
para modelar dados de contagem, no entanto sempre que existe sobredispersão, torna-se
necessário recorrer a outras distribuições, nomeadamente à distribuição Binomial Negativa.
Outro problema comum nos dados de contagem é o excesso de zeros na variável
resposta. Os modelos de regressão de zeros inflacionados são amplamente usados para
modelar esse tipo de dados. Estes modelos modelam as contagens como uma mistura
de duas distribuições com dois processos subjacentes, um que trata do excesso de zeros
modelado por uma massa pontual, e um outro que trata das contagens sendo modelado
por uma distribuição de Poisson ou Binomial Negativa.
Neste trabalho pretendeu-se estudar os modelos de regressão para dados de contagem
e a sua aplicação a dados bancários relativos a clientes a quem foi garantido crédito de
consumo por um banco. Tem como principal objetivo estudar a relação do número de não
pagamento da prestação do empréstimo de um cliente em função das caracteristicas do
cliente e do contrato. Em particular, foram ajustados os modelos de regressão de Poisson,
modelos de regressão Binomial Negativa, modelos de regressão de Poisson de zeros inflacionados
e modelos de regressão binomial negativa de zeros inflacionados utilizando o
algoritmo EM para obter as estimativas de máxima verosimilhança dos parâmetros.
Os resultados obtidos mostraram que os modelos de regressão de zeros inflacionados
apresentam um melhor ajustamento, quando comparados com os modelos que não
têm em consideração o excesso de zeros. Mostraram ainda que os modelos baseados na
distribuição Binomial Negativa, são os mais adequados para modelar estes dados, em vez
dos modelos baseados na distribuição de Poisson. Regression models for count data are highly used in several areas of study for modelation of phenomena. These models feature a special methodological board that comes from the fact that the response variable just takes non-negative integer values. The Poisson distribution is the most recognized and most widely used to model count data, however when there is overdispersion, it becomes necessary the use other distributions, as so, including negative binomial distribution. Another common problem in count data, is the excess of zeros in the response variable. Zero inflated regression models are widely used to model this type of data. These models model the counts as a mixture of two distributions with two underlying processes, one that deals with excess of zeros modeled by a pontual mass, and another one that handles the counts by being modelated by a Poisson or Negative Binomial distributions. In this work we intended to study regression models for count data and its application on bank data clients to whom it was granted consumption credit by a bank. Its main objective is to study the relationship of the number of non payment of the installment of a client depending on the characteristics of client and the contract. In particular, we fit the Poisson regression models, negative binomial regression models, zero inflated Poisson regression models and negative binomial regression models for zero inflated using the EM algorithm to obtain maximum likelihood estimates of the parameters. The results showed that zero inflated regression models have a better fit compared with models that do not take into account the extra zeros. Also showed that models based on the negative binomial distribution, are more suitable for modeling this data instead of models based on Poisson distribution. |
Tipo: | Dissertação de mestrado |
Descrição: | Dissertação de mestrado em Estatística |
URI: | https://hdl.handle.net/1822/29402 |
Acesso: | Acesso aberto |
Aparece nas coleções: | BUM - Dissertações de Mestrado DMA - Dissertações de mestrado |
Ficheiros deste registo:
Ficheiro | Descrição | Tamanho | Formato | |
---|---|---|---|---|
Tese_Jorge Helder Pereira dos Santos_2013.pdf | 3,75 MB | Adobe PDF | Ver/Abrir |