A análise da qualidade de grãos é um dos gargalos encontrados na cadeia produtiva do setor cafeeiro, tendo em vista que atualmente é feita de forma manual. Buscando uma solução para o problema, este trabalho apresenta um método baseado em visão computacional e redes neurais artificiais para identificar vinte e uma classes de grãos de café em amostras. No total, 421 atributos de três diferentes naturezas – morfologia, cor e textura – foram reunidos para compor o conjunto de características utilizado pela rede neural. Os atributos morfológicos são: Descritores de Fourier, Descritores Genéricos de Fourier, Momentos de Zernike, elementos do Modelo Autorregressivo e um conjunto de atributos diversos. Após avaliar duas abordagens para os atributos de cor – histogramas de frequências de cor e atributos estatísticos desses histogramas – a segunda foi escolhida e, assim, os atributos de cor adotados foram: média, variância, obliquidade, energia, curtose, entropia e suavidade de histogramas globais de cor, calculados para os espaços de cor RGB, HSV, I 1 I 2 I 3 e CIELAB. Visando um melhor desempenho, os descritores de Haralick foram modificados para que dois pixels de referência fossem utilizados no cálculo da matriz de coocorrência. A versão modificada dos descritores superou as originais, e assim, seus valores calculados com o espaço de cor I 1 I 2 I 3 (aquele que apresentou melhor eficácia em testes) foram utilizados como atributos de textura. O conjunto de atributos foi arranjado em cinco subconjuntos, cada um contendo diferentes combinações das distintas naturezas de atributos e sendo associado a uma análise. Para cada subconjunto selecionaram-se os melhores elementos pelas técnicas chi-quadrado, ganho de informação e PCA (Principal Component Analysis). O resultado dessa seleção determinou as entradas para três processos classificatórios, que foram avaliados a fim de se determinar o mais efetivo. Após as avaliações, e sendo determinada a melhor configuração, o processo classificatório escolhido proporcionou a acurácia de 85,08%, superando trabalhos correlatos.
The quality asssessment of beans is one of the bottlenecks found in the production chain of the coffee industry, as nowadays it is done manually. Seeking a solution for the problem, this work presents a method based on computer vision with neural networks to identify twenty-one classes of coffee beans in samples. In total, 421 features of three different types – morphological, colour and textural – were gathered to compose the feature set used by the neural network. The morphological features were Fourier Descriptors, Generic Fourier Descriptors, Zernike Moments, elements from Autoregressive Model and a miscellaneous set. After evaluating two approaches of colour features – colour frequency histograms and statistics from those histograms – the latter was chosen and the colour features comprised the mean, variance, skewness, kurtosis, energy, entropy and smoothness of global histograms calculated for the channels of the RGB, HSV, I 1 I 2 I 3 and CIELAB colour spaces. Seeking better performance the Haralick features were modified, so two pixels were used as reference in the computation of the Grey Level Co-occurrence Matrix. The modified versions of the features outperformed the original ones and their computations with the I 1 I 2 I 3 colour space (the one that provided the best results in tests) were used as textural features. The feature set was then rearranged in five intersecting subsets, each one containing different combinations of the feature types and being associated with an analysis. For each subset the best elements were selected using the techniques PCA (Principal Component Analysis), chi-squared and information gain. The resulting selections were used to determine the inputs to three classification processes, which were evaluated in order to select the most effective. After all evaluations, and having determined the best configuration, the selected classification process yielded an overall accuracy of 85.08%, outperforming related works.