Seqüências potencialmente envolvidas na resistência do cafeeiro a doenças foram identificadas, por meio de análise in silico, a partir das informações geradas pelo Projeto Brasileiro do Genoma Café (PBGC). Para isso foram usadas três estratégias. Inicialmente, palavras-chave correspondentes a termos relacionados aos mecanismos de resistência de plantas a patógenos foram identificadas na literatura e utilizadas como “iscas” para a mineração dos dados. Com o auxílio de ferramentas disponíveis na plataforma de bioinformática do PBGC, foram identificadas ESTs (Expressed Sequence Tags) relacionadas a cada uma destas palavras. Outra estratégia utilizada foi a busca por similaridades entre algumas seqüências públicas envolvidas com a resistência do cafeeiro a doenças com as seqüências do PBGC, por meio do programa BLAST. Utilizou-se, também, o Electronic Northern, uma ferramenta desenvolvida pelo Laboratório de Genômica e Expressão (LGE). A mineração, usando as três estratégias, identificou 14.060 seqüências do PBGC. Essas seqüências apresentaram similaridade com proteínas conhecidamente relacionadas com o processo de defesa da planta contra doenças como, por exemplo, quitinase, proteína quinase, citocromo P450, proteína de resistência a doenças, proteína relacionada com patogênese, proteínas com domínio LRR e NBS, proteínas induzidas por hipersensibilidade, entre outras. Os processos biológicos com os quais essas seqüências estão envolvidas incluíram metabolismo, transporte, regulação da transcrição, enovelamento de proteínas, biossíntese entre outros. A análise global baseada em ontologia de função molecular das seqüências obtidas mostrou que os genes estão envolvidos com metabolismo, resposta a estímulos externos, diferenciação celular, ligação a ácidos nucléicos, ligação a nucleotídeos, resposta de defesa, apoptose entre outras. Visando verificar o envolvimento destas seqüências com a resistência do cafeeiro à ferrugem foram desenhados 40 primers para amplificar algumas das seqüências mineradas. Os primers foram desenhados com o programa computacional Primer3 e a estabilidade desses foi verificada por meio do programa PrimerSelect. Diferentes concentrações dos componentes da reação de PCR foram analisadas. Utilizando as condições de reação e amplificação otimizadas, os 40 primers foram testados em 12 genótipos resistentes e 12 susceptíveis a Hemileia vastatrix, fungo causador da ferrugem. Vinte e nove destes 40 primers resultaram em bandas únicas e bem definidas, sendo um polimórfico. Este trabalho permitiu obter, até o momento, um marcador molecular polimórfico entre os indivíduos resistentes e susceptíveis. Esse marcador, denominado CARF 005, amplifica uma região do DNA que corresponde a uma ORF parcial de Coffea arabica que codifica uma proteína de resistência a doenças.
Sequences potentially involved with the coffee resistance were identified, by in silico analyses, using information generated by the Projeto Brasileiro do Genoma Café (PBGC). For that, three strategies were used. Initially, keywords related to the plants resistance mechanism to pathogens were searched in scientific literature and used as drivers for data mining. Using the available tools at the PBGC bioinformatics platform, ESTs (Expressed Sequence Tags) related to each one of these words were identified. The search for similarities between some published sequences and sequences from the PBGC, by using the BLAST program was another strategy. The Electronic Northern, a tool developed by the Laboratório de Genômica e Expressão (LGE), was also used. Those strategies allowed the identification of 14,060 sequences of the PBGC. These sequences were similar to proteins known to be related to de plant disease defense process, for instance chitinase, kinase protein, cytochrome P450, disease resistance protein, pathogenesis related protein, LRR and NBS proteins, hypersensibility induced protein among others. The biological processes with witch these sequences are involved included metabolism, transport, transcription regulation, protein folding, biosynthesis and others. The ontology-based global analysis for molecular function showed that the genes are involved with metabolism, external stimulus response, cellular differentiation, nucleic acid binding, nucleotide binding, defense response, apoptosis and others. Aiming to verify the involvement of these sequences with the coffee tree resistance to leaf rust, 40 primers were designed to amplify the mined sequences. The primers were synthesized using the computational program Primer3 and their stability was tested by the program PrimerSelect. Different PCR conditions were tested. Using optimized reaction and amplification conditions, those 40 primers were tested in 12 resistant and 12 susceptible genotypes to Hemileia vastatrix, fungus that causes coffee leaf rust. Twenty nine of those resulted in unique and sharp bands, and only one of these was polymorphic. The 40 primers permitted to find one molecular marker polymorphic between the resistant and susceptible genotypes. This marker amplifies a region of the DNA which corresponds to a Coffea Arabica ORF for disease resistance protein.