Uma alternativa para diagnóstico e análise de dados multinomiais com superdispersão: aplicação à Fruticultura.
Conteúdo do artigo principal
Resumo
Em experimentos agronômicos é comum a presença de variáveis politômicas e o modelo dos logitos generalizados é uma classe de modelos de regressão que podem ser empregadas para a análise desses dados. Uma das características do modelo dos logitos generalizados é a pressuposição de que a variância é uma função conhecida da média e, espera-se que a variância observada esteja próxima da pressuposta pelo modelo. No entanto, não é raro ocorrer uma variação extra-multinomial, devido à observação sistemática de dados mais heterogêneos do que a variância especificada pelo modelo, fenômeno este conhecido como superdispersão. Neste contexto, o presente trabalho tem como objetivo discutir a importância de diagnosticar o problema da superdispersão em dados multinomiais, com proposta de uma medida descritiva para diagnóstico,
assim como apresentar uma alternativa metodológica por meio do modelo Dirichletmultinomial. A medida descritiva foi avaliada por meio de simulação, restringindo-se a dois cenários particulares. Como um estudo de motivação tem-se um experimento
aplicado à fluticultura, cujo o objetivo foi avaliar o florescimento de plantas adultas de uma laranjeira, enxertadas sobre o limão “Cravo” e o citrumelo “Swingle”, tendo com variável resposta à classificação de ramos das plantas em três categorias: terminal, lateral, sem flor ou abortada. Por meio da medida descritiva proposta verificou-se evidências de superdispersão, indicando que o modelo dos logitos generalizados pode não ser o mais apropriado. Dessa forma, como alternativa metodológica utilizou-se o modelo Dirichlet-multinomial. Comparativamente ao modelo dos logitos generalizados
o Dirichlet-multinomial mostrou-se mais adequado para o ajuste de dados com
superdispersão por permitir a inclusão de um parâmetro adicional para acomodar a dispersão excessiva extra-multinomail.
Detalhes do artigo
Este trabalho está licenciado sob uma licença Creative Commons Attribution 4.0 International License.
Authors who publish with this journal agree to the following terms:
- Authors retain copyright and grant the journal right of first publication with the work simultaneously licensed under a Creative Commons Attribution License that allows others to share the work with an acknowledgement of the work's authorship and initial publication in this journal.
- Authors are able to enter into separate, additional contractual arrangements for the non-exclusive distribution of the journal's published version of the work (e.g., post it to an institutional repository or publish it in a book), with an acknowledgement of its initial publication in this journal.
- Authors are permitted and encouraged to post their work online (e.g., in institutional repositories or on their website) prior to and during the submission process, as it can lead to productive exchanges, as well as earlier and greater citation of published work (See The Effect of Open Access).
Referências
AGRESTI, An introduction to categorical data analysis, John Wiley & Sons, 2019.
CHEN, J.; LI, H.Variable selection for sparse Dirichlet-multinomial regression with an application to microbiome data analysis. Annals of Applied Statistics, v.7, n.1, p.418–442, 2013. ISSN 19326157.
FREITAS, S. M. Modelos para proporções com superdispersão provenienetes de ensaios toxicológicos no tempo. 124p. Tese (Doutorado) — Universidade de São Paulo / Escola Superior Agricola "Luiz de Queiroz", 2001.
MORAL, R. A.; HINDE, J.; DEMÉTRIO, C. G. B. Half-Normal Plots and Overdispersed Models in R : The hnp Package. Journal of Statistical Software, v.8, n.10, 23p., 2017.
MORAL, R. d. A.; HINDE, J.; DEMÉTRIO, C. G. B. Half-Normal Plots with Simulation Envelopes. [S.l.]: 2018-05-21, 2018. 28p.
MOREL, J. G.; NAGARAJ, N. K. A Finite Mixture Distribution for Modelling Multinomial Extra Variation. Biometrika Trust, Oxford University Press, v.80, n.2, p.363–371, 1992.
MOSIMANN, J. E. On the Compound Multinomial Distribution , the Multivariate β- Distribution , and Correlations Among Proportions. Biometrika Trust, Oxford University Press, v.49, n. 1, p.65–82, 1962.
NELDER, J. A.; WEDDERBURN, R. W. M. Generalized Linear Models. v.135, n.3, p.370–384, 1972.
OLSSON, U. Generalized Linear Models An Applied Approach. [S.l.]: Lund: Studentlitteratur, 2002. 232p. ISBN 9789144031415.
PAUL, S. R.; LIANG, K. Y.; SELF, S. G. On Testing Departure from the Binomialand Multinomial Assumptions. v.45, n.1, p.231–236, 1989.
VENABLES, W. N.; RIPLEY, B. D. Modern Applied Statistics with S. Fourth. New York: Springer, 2002. ISBN 0-387-95457-0.
VOIGT, V. Caracterização fenotípica e avaliação da expressão de genes envolvidos na indução e no florescimento da laranjeirax11. Tese (Doutorado) — Universidadede São Paulo, 2013.
ZHANG, Y.; ZHOU, H.Mglm: Multivariate response generalized linear models. R package version 0.2.0, v.7, 2016.