Café é uma importante commodity e um dos produtos agrícolas mais comercializados e consumidos no mundo. Por isso, o seqüenciamento em larga escala de seqüências expressas (ESTs) em órgãos de espécies de cafeeiro foi realizado e resultou na formação do banco de dados brasileiro do genoma funcional de café (CafEST). Apesar da produção e consumo de Coffea arabica corresponder à cerca de 70% do mercado de café, essa espécie é altamente susceptível a nematóides, pragas e patógenos. Portanto, há um crescente interesse de programas de melhoramento genético de cafeeiro em desenvolver variedades de C. arabica com resistência a esses agentes fitopatológicos. Inúmeros genes de resistência (genes R) já foram isolados de várias plantas e foram agrupados em classes de 1 a 6. Com o objetivo de elucidar se subclasses das 6 classes de genes R estão representadas nos genomas de espécies de café, uma estratégia de identificação de genes baseada em mineração de dados genômicos está sendo empregada para selecionar ESTs do banco CafEST que representem cada classe e subclasse já descrita. O presente trabalho relata a presença de um total de 293 ESTs relacionadas com genes R classe 3 (genes do tipo LRR/NBS/TIR) no genoma de C. arabica, as quais foram identificadas dentro do banco CafEST por homologia no BLAST. Dentre essas seqüências, 101 representam a subclasse RPP4 e foram agrupadas em 56 clusters. Adicionalmente, 93 ESTs representando a subclasse RPP5 foram encontradas e agrupadas em 46 clusters. Finalmente, as últimas 99 ESTs encontrados representam a subclasse RPS4 e foram agrupadas em 54 clusters. No entanto, nenhuma EST foi encontrada representando as outras subclasses de genes R classe 3 (L, M, N, P e RPP1) no banco CafEST com base nos critérios empregados. A estratégia usada para selecionar ESTs de C. arabica que potencialmente codificam genes R classe 3 dentro do CafEST permitiu a identificação de vários prováveis genes.
Coffee is a very important commodity and one of the main commercialized and consumed crops worldwide. For this reason, the sequencing in large scale of expressed sequence tags (ESTs) from coffee organs was performed and resulted in the formation of the Brazilian Coffee Genome EST database (CafEST database). Although C. arabica production and consumption corresponds to approximately 70 % of the coffee market, it is highly susceptible to nematodes, pests and diseases. Therefore there is a raising interest of genetic breeding programs in developing C. arabica varieties with resistance to these phytopathological agents. A large number of plant resistance genes (R genes) have already been isolated and were classified into six categories denoted class1-class 6. Herein it is presented a screening of the coffee transcriptome database for class 3 LLR/NBS/TIR-like R gene related sequences within the Coffea arabica ESTs from the CafEST data bank. Based on sequence similarities in homologue searches we selected a total of 293 ESTs encoding for class 3 R proteins putative related to disease resistance in C. arabica. Among these reads, 101 ESTs representing the RPP4 subclass were grouped into 56 clusters. We found 93 reads representing the RPP5 subclass and which were grouped into 46 clusters. In addition, we also found 99 reads representing the RPS4 subclass and which were grouped into 54 clusters. However, no EST was found representing other subclasses of R genes (L, M, N, P and RPP1) in CafEST database based on adopted criteria. The used approach to select ESTs from C. arabica that putatively encode potencialmente R genes classe 3 dentro do CafEST led to identification of several putative genes.