A ferrugem é a principal doença do cafeeiro, podendo gerar perdas significativas na produção, caso medidas de controle não sejam adotadas. Modelos de alerta de doenças agrícolas são capazes de gerar informações para aplicações de defensivos somente quando necessário, reduzindo gastos por parte do produtor e impactos ambientais. Objetivou-se, neste trabalho, desenvolver, comparar e selecionar modelos de alerta baseados em técnicas de mineração de dados para a predição da ferrugem do cafeeiro, em anos de alta e baixa carga pendente de frutos. Foram utilizados dados obtidos em lavouras de café em produção, ao longo de 13 anos (1998-2011). Vinte e três atributos foram considerados como variáveis independentes (preditoras) e, como variável dependente, a taxa de progresso mensal da ferrugem do cafeeiro, obtida a partir de dados de incidência da doença. Os atributos mais importantes do conjunto de dados foram filtrados por métodos de seleção de atributos e a modelagem foi realizada por meio de quatro técnicas de mineração de dados: máquinas de vetores suporte, redes neurais artificiais, árvores de decisão e florestas aleatórias. Para anos de alta e baixa carga pendente de frutos, as melhores taxas de acerto foram 85,3% e 88,9%, respectivamente. Outras medidas de desempenho como sensitividade e especificidade também apresentaram valores altos e equilibrados. Os modelos desenvolvidos neste trabalho fornecem melhores subsídios para o monitoramento da doença, em anos de alta carga pendente de frutos do que outros modelos existentes, além de prover uma possibilidade de monitoramento, em anos de baixa carga pendente de frutos.
Coffee rust can cause severe yield losses if control measures are not taken. Warning models are capable of generating useful information regarding to the application of fungicides, decreasing economic losses and environmental impacts. The aim of this study was to develop, compare and select warning models developed by data mining techniques in order to predict the coffee rust in years of high and low fruit load. For 13 years (1998-2011), data was collected from an automatic weather station. The independent variables were 23, obtained from the weather station, and the dependent variable was the monthly progress rate for the coffee rust, which was generated by the values of disease incidence. The most important features were refined by feature selection techniques, and the modeling was performed using four data mining techniques: support vector machines, artificial neural networks, decision trees and random forests. For high fruit load years the best accuracy was 85.3% and for low fruit load years it was 88.9%. Other performance measures like recall and specificity also had high and balanced values. The warning models developed on this study provide further information for monitoring the disease on high fruit load years than other models previously developed, and also provide a possibility for the monitoring on years of low fruit load.