ÁRVORE DE DECISÃO COMO FERRAMENTA NA CLASSIFICAÇÃO DE ACESSOS DE FEIJÃO-FAVA

Palavras-chave: Phaseolus lunatus L. Aprendizado de máquina. Inteligência computacional. Métodos multivariados.

Resumo

Estudos de caracterização morfoagronômica que visam a discriminação e classificação de acessos de feijão-fava quanto aos centros de domesticação e estado biológico têm sido de grande importância para a conservação da biodiversidade da espécie. Para esse fim, é muito utilizada a análise multivariada denominada análise discriminante, que nem sempre é capaz de produzir resultados satisfatórios. Classificadores baseados em inteligência computacional constituem-se ferramentas adicionais para a compreensão de problemas complexos de classificação. Neste estudo, objetivou-se testar o uso da árvore de decisão na classificação do feijão-fava de acordo com os centros de domesticação e estado biológico (cultivado e silvestre), com base em oito caracteres fenotípicos da semente. Foram avaliados 60 acessos de feijão-fava do Banco de Germoplasma de Phaseolus da Universidade Federal do Piauí (BGP/UFPI), em cuja classificação foram utilizadas duas abordagens: estatística convencional com análise discriminante sob componentes principais (DAPC) e inteligência computacional por meio da árvore de decisão (AD). Os resultados mostraram que o uso da AD foi eficiente para identificar padrões na classificação dos acessos de feijão-fava, devido à sua compreensibilidade. O peso da semente foi um dos principais descritores utilizado para explicar a origem e a diversidade da espécie. Os resultados encontrados serão úteis para estudos que envolvem a conservação de recursos genéticos, principalmente para a manutenção de bancos de germoplasma e em programas de melhoramento. Além disso, recomenda-se a integração de algoritmos de aprendizado de máquina em estudos voltados à classificação de feijão-fava.

 

Referências

ASSUNÇÃO-NETO, W. V. et al. Genetic diversity in Phaseolus lunatus L. based on morphological seed characters. Annual Report of the Bean Improvement Cooperative, 61: 199-200, 2018.

BAUDET, J. C. The taxonomic status of the cultivated types of lima bean (Phaseolus lunatus L.). Tropical Grain Legume, 7: 29-30, 1977.

BAUDOIN, J. P. et al. Ecogeography, demography, diversity and conservation of Phaseolus lunatus L. in the Central Valley of Costa Rica. Systematic and Ecogeographic Studies on Crop Genepools 12, Rome, Italy: International Plant Genetic Resources Institute, 2004. 85 p.

BREIMAN, L. et al. Classification and regression trees. 1. ed. Belmont, CA: WADSWORTH, 1984. 358 p.

CHACÓN-SÁNCHEZ, M. I.; MARTÍNEZ-CASTILLO, J. Testing Domestication Scenarios of Lima Bean (Phaseolus lunatus L.) in Mesoamerica: Insights from Genome-Wide Genetic Markers. Frontiers in Plant Science, 8: 1-20, 2017.

CRUZ, C. D.; REGAZZI, A. J.; CARNEIRO, P. C. S. Modelos biométricos aplicados ao melhoramento genético. vol. 2. 3 ed. Viçosa, MG: UFV, 2014. 668 p.

GUTIÉRREZ-SALGADO, A.; GEPTS, P.; DEBOUCK, D. G. Evidence for two gene pools of the Lima bean, Phaseolus lunatus L., in the Americas. Genetic Resources and Crop Evolution, 42: 15-28, 1995.

IPGRI. Descritores para Phaseolus lunatus (feijão-espadinho). International Plant Genetic Resources Institute, Bioversity Technical Bulletin Series. Rome: Bioversity International. 2001. 51 p.

JOMBART, T.; AHMED, I. adegenet 1.3-1: New tools for the analysis of genome-wide SNP data. Bioinformatics, 27: 3070-3071, 2011.

LIAKOS, K. G. et al. Machine learning in agriculture: a review. Sensors, 18: 2674-2703, 2018.

MILBORROW, S. rpart.plot: plot “rpart” models: an enhanced version of “plot.rpart”, R package version 3.0.8. 2019. Disponível em: <https://cran.r-project.org/package=rpart.plot>. Acesso em: 04 dez. 2019.

MONTERO-ROJAS, M. et al. Genetic, morphological and cyanogen content evaluation of a new collection of Caribbean Lima bean (Phaseolus lunatus L.) landraces. Genetic Resources and Crop Evolution, 60: 2241-2252, 2013.

MOTTA-ALDANA, J. R. et al. Multiple Origins of Lima Bean Landraces in the Americas: Evidence from Chloroplast and Nuclear DNA Polymorphisms. Crop Science, 50: 1773-1787, 2010.

NOGUEIRA, A. P. O. et al. Novas características para diferenciação de cultivares de soja pela análise discriminante. Ciencia Rural, 38: 2427-2433, 2008.

PILTAVER, R. et al. What makes classification trees comprehensible? Expert Systems With Applications, 62: 333-346, 2016.

R DEVELOPMENT CORE TEAM. R: a language and environment for statistical computing. Vienna: R Foundation for Statistical Computing, 2018.

SANT’ANNA, I. C. et al. RNA - Aplicações em estudos classificatórios. In: CRUZ, Cosme Damião; NASCIMENTO, Moysés. (Eds.). Inteligência computacional aplicada ao melhoramento genético. 1. ed. Viçosa: UFV, 2018. cap. 7. p. 189-214.

SILVA, R. N. O. et al. Phenotypic diversity in lima bean landraces cultivated in Brazil, using the Ward-MLM strategy. Chilean Journal of Agricultural Research, 77: 35-40, 2017.

TANABATA, T. et al. SmartGrain: High-throughput phenotyping software for measuring seed shape through image analysis. Plant Physiology, 160: 1871-1880, 2012.

THERNEAU, T.; ATKINSON, B. rpart: Recursive partitioning and regression trees, R package version 4.1-15. 2019. Disponível em: <https://cran.r-project.org/package=rpart>. Acesso em: 04 dez. 2019.

TRABELSI, A.; ELOUEDI, Z.; LEFEVRE, E. Decision tree classifiers for evidential attribute values and class labels. Fuzzy Sets and Systems, 366: 46-62, 2019.

Publicado
2021-05-10
Seção
Nota Técnica