DANÚBIA RODRIGUES ALVES CARACTERIZAÇÃO DE UMA REGIÃO GENÔMICA DO HÍBRIDO DE TIMOR CIFC 832/2 ASSOCIADA À RESISTÊNCIA À Hemileia vastatrix Dissertação apresentada à Universidade Federal de Viçosa, como parte das exigências do Programa de Pós- Graduação em Genética e Melhoramento, para obtenção do título de Magister Scientiae. VIÇOSA MINAS GERAIS - BRASIL 2019 Ficha catalográfica preparada pela Biblioteca Central da Universidade Federal de Viçosa - Câmpus Viçosa   T   Alves, Danúbia Rodrigues, 1992- A474c 2019         Caracterização de uma região genômica do híbrido de timor CIFC 832/2 associada à resistência à Hemileia vastatrix / Danúbia Rodrigues Alves. – Viçosa, MG, 2019.           ix, 65 f. : il. (algumas color.) ; 29 cm.               Inclui apêndices.           Orientador: Eveline Teixeira Caixeta.           Dissertação (mestrado) - Universidade Federal de Viçosa.           Referências bibliográficas: f. 27-32.               1.  Bioinformática. 2.  Ferrugem-do-cafeeiro. 3.  Sequenciamento de nucleotídeo. I. Universidade Federal de Viçosa. Departamento de Biologia Geral. Programa de Pós-Graduação em Genética e Melhoramento. II. Título.     CDD 22. ed. 570.285   ii A Deus, por guiar meus passos, Aos meus pais, Irene e Pedro, E ao Arthur, Por todo amor e dedicação, Dedico iii AGRADECIMENTOS A Deus, por iluminar o meu caminho. Aos meus pais, Irene e Pedro, por todo amor e por acreditarem nos meus sonhos. À minha família e aos amigos que mesmo de longe estiveram presentes no meu coração. Ao Arthur pelo carinho, companheirismo, compreensão e incentivo. Com você ao meu lado o caminho se tornou mais fácil. À Universidade Federal de Viçosa e ao Programa de Pós Graduação em Genética e Melhoramento, pela qualidade do ensino. Ao Instituto de Biotecnologia Aplicada à Agropecuária (BIOAGRO), pela infraestrutura disponibilizada à realização do trabalho. À minha orientadora, Dra. Eveline Teixeira Caixeta, pelos ensinamentos, confiança e incentivo. À minha coorientadora Dra. Dênia Pires de Almeida pelos ensinamentos transmitidos, pela dedicação na realização desse trabalho e pela amizade. Ao meu coorientador Prof. Tiago Antônio de Oliveira Mendes pelo apoio, pela disponibilidade e pelas contribuições para essa dissertação. À Dra. Gilza Barcelos de Souza pelas contribuições para a melhoria dessa dissertação. À Dra. Poliane Marcele Ribeiro Cardoso e ao Dr. Antonio Carlos Baião de Oliveira, pela disponibilidade de participação na banca. Aos amigos que são a minha família em Viçosa, por dividirem comigo o medos e também os bons momentos. Em especial a minha companheira de mestrado, Ruane. Aos amigos do Biocafé pelo apoio, pela amizade e por tornarem os meus dias mais agradáveis. À Samila, ao Pedro e ao Edson pelas contribuições neste trabalho. À Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES), pela concessão da bolsa de mestrado. Aos secretários do PPGGM, Marco Túlio e Odilon, pela dedicação e boa vontade em nos ajudar. A todos que de alguma forma contribuíram para a minha formação pessoal e profissional. Meus sinceros agradecimentos. iv “A persistência é o menor caminho do êxito.” Charles Chaplin v RESUMO ALVES, Danúbia Rodrigues, M.Sc., Universidade Federal de Viçosa, julho de 2019. Caracterização de uma região genômica do Híbrido de Timor CIFC 832/2 associada à resistência à Hemileia vastatrix. Orientadora: Eveline Teixeira Caixeta. Coorientadores: Dênia Pires de Almeida e Tiago Antônio de Oliveira Mendes. A ferrugem do cafeeiro, causada pelo fungo biotrófico Hemileia vastatrix é a principal doença de importância econômica dessa cultura, sendo responsável por grandes prejuízos à cafeicultura mundial. Novas raças do patógeno têm surgido infectando cultivares de café comercializados como resistentes a essa doença. Desse modo, devido ao alto potencial adaptativo do fungo, a busca por cafeeiros resistentes a essa doença é uma atividade recorrente nos programas de melhoramento. Estudos com o Híbrido de Timor (HdT), tem sido realizados em pesquisas que visam resistência durável à ferrugem e outras doenças do cafeeiro. Compreender a natureza da resistência duradoura em genótipos do HdT e descrever os genes envolvidos na defesa das plantas é fundamental para o uso eficiente dos recursos disponíveis nesse híbrido natural. A utilização de ferramentas moleculares e de bioinformática tem mostrado resultados significativos para a ampliação do conhecimento dos genes envolvidos no patossistema Coffea - H. vastatrix. Desse modo, objetivou-se com esse estudo sequenciar e caracterizar, por meio de análises de bioinformática, uma região do genoma do Híbrido de Timor CIFC 832/2, que contém marcadores associados à resistência à H. vastatrix. Para isso foi realizado o sequenciamento do clone BAC 70-22F contendo a marca funcional de resistência, por meio da Plataforma Illumina MiSeq (paired – end reads). Posteriormente foi feita a montagem dos contigs e a predição dos genes. Realizou-se a anotação gênica com base nos genomas de Coffea arabica, Coffea canephora e Coffea eugenioides, utilizando a ferramenta BLAST. A anotação gênica revelou a presença de genes candidatos relacionados ao mecanismo de resistência de hospedeiros contra patógenos. Foram anotados 991 genes do clone BAC 70-22F. Desses genes, 340 foram anotados com similaridade com o genoma de C. arabica (var. Caturra), 337 com o genoma de C. eugenioides e 314 com o genoma de C. canephora (clone IF 200). Com base na anotação gênica foram selecionadas duas sequências de genes candidatos a receptores like kinases (RLK) e desenhados primers para estudo do perfil de expressão gênica durante a interação Coffea - H. vastatrix. Um possível gene de resistência, LRR receptor-like serine/threonine-protein kinase GSO2, foi descrito e apresentou um perfil vi de expressão correspondente a uma resposta de resistência pré-haustorial. O outro possível receptor like kinase em estudo, apresentando um domínio LRR, exibiu uma diminuição na expressão gênica pré-haustorial em genótipos incompatíveis. As análises filogenéticas desses genes, bem como os estudos de identidade e similaridade genética da região genômica clonada, demonstraram uma relação mais próxima entre o clone BAC 70-22F e a espécie C. arabica e corroboram com a diversidade genética descrita para o HdT. Os resultados sugerem que a região genômica clonada do HdT CIFC 832/2 possui importantes genes candidatos a resistência do cafeeiro à H. vastatrix e apresentam informações relevantes para ampliar o conhecimento sobre o HdT, podendo contribuir para futuros planejamentos de estratégias de melhoramento do cafeeiro. vii ABSTRACT ALVES, Danúbia Rodrigues, M.Sc., Universidade Federal de Viçosa, July, 2019. Characterization of a genomic region of the Híbrido de Timor CIFC 832/2 associated with resistance to Hemileia vastatrix. Advisor: Eveline Teixeira Caixeta. Co-advisers: Dênia Pires de Almeida and Tiago Antônio de Oliveira Mendes. Coffee leaf rust, caused by the biotrophic fungus Hemileia vastatrix is the main disease of economic importance of this crop, being responsible for major damages to world coffee. New races of the pathogen have emerged infecting coffee cultivars marketed as resistant to this disease. Thus, due to the high adaptive potential of the fungus, the search for coffee resistant to this disease is a recurrent activity in breeding programs. Studies with the Híbrido de Timor (HdT) have been conducted in research aimed at durable resistance to rust and other coffee diseases. Understanding the nature of enduring resistance in HdT genotypes and describing the genes involved in plant defense is critical to the efficient use of the resources available in this natural hybrid. The use of molecular and bioinformatics tools has shown significant results to increase the knowledge of the genes involved in the Coffea - H. vastatrix pathosystem. Thus, the aim of this study was to sequencing and characterize, through bioinformatics analysis, a region of the Híbrido de Timor CIFC 832/2 genome, which contains markers associated with resistance to H. vastatrix. For this, the sequencing of clone BAC 70-22F containing the functional resistance mark was performed by means of the Illumina MiSeq Platform (paired - end reads). Subsequently, the contigs were assembled and the genes predicted. Genic annotation was performed based on the genomes of Coffea arabica, Coffea canephora and Coffea eugenioides, using the BLAST tool. The gene annotation revealed the presence of candidate genes related to the mechanism of host resistance against pathogens. 991 genes of clone BAC 70-22F were noted. Of these genes, 340 were noted similarly with the C. arabica genome (var. Caturra), 337 with the C. eugenioides genome and 314 with the C. canephora genome (clone IF 200). Based on the gene annotation, two sequences of candidate genes receptor like kinases (RLK) were selected and primers designed to study the gene expression profile during the Coffea - H. vastatrix interaction. A possible resistance gene, receptor-like serine / threonine protein kinase GSR2 LRR, has been described and has an expression profile corresponding to a pre-haustorial resistance response. The other possible receptor like kinase under study, presenting an LRR domain, exhibited a decrease in pre-haustorial viii gene expression in incompatible genotypes. Phylogenetic analyzes of these genes, as well as genetic identity and similarity studies of the cloned genomic region, demonstrated a closer relationship between clone BAC 70-22F and C. arabica and corroborated the genetic diversity described for HdT. The results suggest that the cloned genomic region of HdT CIFC 832/2 has important candidate genes for resistance to H. vastatrix coffee and presents relevant information to increase knowledge about HdT and may contribute to future planning of coffee breeding strategies. ix SUMÁRIO 1. Introdução ..................................................................................................................... 1 2. Material e Métodos ....................................................................................................... 5 2.1. Rastreio e sequenciamento do clone BAC ................................................................ 5 2.2. Análises de bioinformática ........................................................................................ 6 2.2.1. Montagem de contigs ............................................................................................. 6 2.2.2. Predição gênica ....................................................................................................... 7 2.2.3. Anotação de genes .................................................................................................. 7 2.3. Análise de expressão gênica ...................................................................................... 7 2.4. Estudos filogenéticos ................................................................................................. 9 3. Resultados ................................................................................................................... 10 3.1. Rastreio e sequenciamento do clone BAC .............................................................. 10 3.2. Análises de bioinformática ...................................................................................... 11 3.3. Análise de expressão gênica .................................................................................... 12 3.4. Estudos filogenéticos ............................................................................................... 13 4. Discussão.....................................................................................................................20 5. Conclusões .................................................................................................................. 25 Referências Bibliográficas ....................................................................................... .267 Apêndices ...................................................................................................................33 1 1. Introdução As perdas na produção cafeeira é um dos problemas de destaque enfrentado pelos cafeicultores devido à suscetibilidade do café a diferentes doenças (CARVALHO et al., 2012). A principal doença de importância econômica dessa cultura é a ferrugem, causada pelo fungo biotrófico Hemileia vastatrix, que ocasiona grandes prejuízos à cafeicultura mundial (AVELINO et al., 2015; ZAMBOLIM, 2016). A maioria das variedades comerciais de Coffea arabica, espécie de grande valor econômico, é suscetível a essa doença (ZAMBOLIM, 2016; TALHINHAS et al., 2017). A ferrugem do cafeeiro foi constatada pela primeira vez no Brasil no ano de 1970, na região sul do estado da Bahia. Quatro meses após a primeira observação da doença no país, a ferrugem foi encontrada em diferentes regiões produtoras de café. Hoje, a H. vastatrix está amplamente distribuída nas áreas cafeeiras em todo o mundo e novas raças do patógeno, capazes de suplantar a resistência, têm surgido. (CABRAL et al., 2009; TALHINHAS et al., 2017). O sucesso da infecção do cafeeiro por esse patógeno depende da sua habilidade em suprimir as respostas da planta (JONES e DANGL, 2006). No processo de coevolução de plantas e patógenos, as plantas desenvolveram a capacidade de reconhecer padrões moleculares e efetores do patógeno, ativando uma resposta de defesa elaborada. De forma similar, os patógenos desenvolveram estratégias contra os mecanismos de defesa das plantas, havendo uma complexa dinâmica de evolução na interação planta-patógeno (JONES e DANGL, 2006; FRANTZESKAKIS et al., 2019). As ferrugens formam uma estrutura especializada, haustórios, no mesófilo das células dos seus hospedeiros durante o processo de infecção. Essa estrutura desempenha um papel importante na infecção, sendo responsável pela absorção de nutrientes a partir do hospedeiro. Além disso, induz mudanças estruturais na célula hospedeira, como o rearranjo do citoesqueleto, a migração do núcleo e a condensação da cromatina (MENDGEN e HAHN, 2002). Acredita-se que essas modificações são induzidas pela atuação de proteínas efetoras produzidas nos haustórios, que são secretadas na matriz extra-haustorial e translocadas para o interior da célula vegetal. A resposta de resistência às ferrugens normalmente é observada após a formação dos haustórios indicando que os genes Avr (Avr – avirulência) do patógeno são expressos nessa estrutura (DODDS et al., 2009). https://nph.onlinelibrary.wiley.com/action/doSearch?ContribAuthorStored=Frantzeskakis%2C+Lamprinos 2 O sistema de defesa da planta pode ser representado por um sistema imune inato, constituído por duas linhas de defesa. Na primeira linha de defesa, há o reconhecimento do patógeno por padrões moleculares associados à patógenos (PAMPs – Pathogen Associated Molecular Patterns) ou por padrões moleculares associados à microrganismos (MAMPs – Microbe Associated Molecular Patterns) resultando a imunidade desencadeada por PAMPs/MAMPs (PTI - Pathogen Triggered Immunity) (JONES e DANGL, 2006). Os PAMPs/MAMPs são identificados por receptores de reconhecimento padrão (PRR - Pattern Recognition Receptor) localizados na superfície da membrana celular ou no interior da célula. Eles levam à formação de uma cascata de transdução de sinais ativando a resposta de defesa do hospedeiro. Geralmente os PRRs são proteínas transmembranas pertencentes à classe das proteínas semelhantes a receptores (RLPs) ou receptores do tipo quinases (RLKs) e apresentam repetições ricas em leucina (LRRs) ou motivo de lisina (LysM) no domínio extracelular, região responsável pelo reconhecimento de PAMPs (JONES e DANGL, 2006; BECK et al., 2012). Patógenos bem adaptados muitas vezes são capazes de suplantar a PTI por meio do transporte de proteínas efetoras para o citoplasma do hospedeiro. Dessa forma, uma segunda linha de defesa é ativada, a imunidade desencadeada por efetores (ETI - Effector Triggered Immunity). Essa é uma linha de defesa mais específica e eficaz para alguma(s) raça(s) do patógeno (JONES e DANGL, 2006). Na ETI, as plantas apresentam proteínas de resistência (R) que reconhecem os efetores do patógeno (Avr) resultando em resistência. O reconhecimento de efetores pelas proteínas R pode ser direto (modelo gene-a-gene) ou indireto (modelo guarda). No modelo gene-a-gene, o reconhecimento se dá de forma direta entre as proteínas R e Avr. Por sua vez, no modelo guarda o reconhecimento pelas proteínas R é realizado por meio do monitoramento de uma proteína acessória da planta hospedeira, alvo dos efetores do patógeno (SEKHWAL et al., 2015; REDDY e NARESH, 2018). A maioria dos genes R codificam proteínas que contêm um domínio C-terminal rico em repetições de leucina (LRR) e um domínio conservado contendo sítios de ligação a nucleotídeos (NBS), pertencendo à classe de genes de resistência NBS-LRR. O domínio LRR pode interagir com a proteína Avr ou com um complexo de proteínas formado pela Avr e outras proteínas do hospedeiro. O domínio NBS atua como sinalizadores celulares e provavelmente iniciam a resposta de resistência em plantas (RIBAS et al., 2011; REDDY e NARESH, 2018). Os genes R de diferentes espécies de 3 plantas compartilham domínios conservados e podem ser usados para triagem de genomas de plantas para putativos genes de resistência (REDDY e NARESH, 2018). Análogos de genes de resistência (RGAs) conservam domínios e motivos proteicos que desempenham papéis específicos na defesa da planta contra patógenos (SEKHWAL et al., 2015). A resistência das plantas de cafeeiro na interação com o fungo H. vastatrix é condicionada por no mínimo nove genes dominantes de efeito maior (NORONHA e BETTENCOURT, 1967; BETTENCOURT et al., 1988) e se baseia no modelo gene-a- gene, proposto por Flor (1971). De acordo com esse modelo, ocorre o reconhecimento dos genes Avr das diferentes raças de H. vastatrix, por parte dos fatores de resistência do cafeeiro. Seguindo o modelo gene-a-gene, foi inferida a existência de nove genes de virulência (v1-v9) em H. vastatrix (NORONHA e BETTENCOURT, 1967; BETTENCOURT et al., 1988). Atualmente, o número de perfis de virulência da ferrugem do cafeeiro provavelmente vai muito além das raças caracterizadas (TALHINHAS et al., 2017). A raça XXXIII de H. vastatrix, por exemplo, contém genes (v5,7 ou v5,7,9) capazes de suplantar a resistência de algumas cultivares que foram inicialmente caracterizadas como resistentes ao fungo causador da ferrugem (CAPUCHO et al., 2012). Dessa forma, a obtenção de cultivares com resistência durável tem sido um desafio para os melhoristas. Estudos com o Híbrido de Timor (HdT), um híbrido interespecífico natural entre Coffea arabica e Coffea canephora (BETTENCOURT, 1973), tem sido de grande importância para os progressos alcançados em pesquisas visando a resistência do cafeeiro à H. vastatrix. O HdT e as progênies derivadas do seu cruzamento com outros cultivares vêm sendo estudados em diversas regiões produtoras de café no mundo (TALHINHAS et al., 2017; SOUSA et al., 2017; SILVA et al., 2018). Esse germoplasma tem sido utilizado em programas de melhoramento que visam resistência durável à ferrugem e outras doenças do cafeeiro (SILVA et al., 2018). Entretanto, o HdT ainda contém genes que não foram caracterizados (CAPUCHO et al., 2009; DIOLA et al., 2011; PESTANA et al., 2015). Entre os derivados do HdT, CIFC (Centro de Investigação das Ferrugens do Cafeeiro, Portugal) 832/1 e CIFC 832/2 são de suma importância, pois unem a resistência à patógenos e boas características agronômicas. A resistência do HdT CIFC 832/2 pode ser mais durável do que em outros genótipos de HdT e contém ainda respostas mais rápidas de resistência à ferrugem (BETTENCOURT, 1973; DINIZ et al., 2012). 4 Compreender melhor a diversidade genética e a natureza da resistência duradoura em genótipos do HdT é fundamental para o uso eficiente dos recursos disponíveis nesse híbrido natural (SETOTAW et al., 2010; TALHINHAS et al., 2017). O estudo do perfil de expressão gênica durante a interação Coffea - H. vastatrix pode facilitar a identificação dos genes envolvidos na resistência e auxiliar na compreensão dos mecanismos de defesa da planta (BARKA et al., 2017; FLOREZ et al., 2017). Estudos com o objetivo de entender a diversidade genética do HdT também contribuem para o planejamento de estratégias de melhoramento (SETOTAW et al., 2010). A expansão das pesquisas genômicas, possibilitada pelo desenvolvimento de novas tecnologias, tem aumentado em larga escala a quantidade de informações biológicas disponíveis (ETIENNE et al., 2002; MICHNO e STUPAR, 2018). Os avanços da biotecnologia em conjunto com os estudos de bioinformática, aplicados ao melhoramento, têm auxiliado na compreensão e manipulação gênica (EDWARDS e BATLEY, 2004; MICHNO e STUPAR, 2018). Essas ferramentas possibilitam a ampliação do conhecimento dos genes que estão envolvidos na resistência de Coffea à H. vastatrix, podendo levar a identificação e até mesmo a clonagem de genes essenciais para a resistência do cafeeiro (ETIENNE et al., 2002; FERNANDES-BRUM et al., 2017). Utilizando essas ferramentas, o estudo do transcriptoma da interação Coffea - H. vastatrix, permitiu identificar genes candidatos, relacionados ao mecanismo de defesa do cafeeiro e caracterizar a expressão desses genes em interação compatível e incompatível (Florez et al., 2017). Sendo relatados genes RLKs envolvidos na primeira resposta de defesa da planta. Essa resposta precoce é fundamental para introduzir cascatas de sinalização na PTI e posterior a expressão de genes envolvidos em mecanismos de defesa (KUMAR e KIRTI, 2011). Acredita-se que a resistência pré- haustorial, antes das 24 horas após a inoculação na interação cafeeiro – H. vastatrix, seja mais durável por envolver vários mecanismos de defesa do hospedeiro, consolidando a proteção da planta (HEATH, 2000; LOPES, 2015). O perfil de expressão do gene putative probable receptor-like protein kinase At5g39020, previamente identificado por Florez et al. (2017), mostrou uma resposta pré-haustorial no genótipo resistente e uma expressão mais tardia no genótipo suscetível. Os autores concluíram que esse gene provavelmente está relacionado ao reconhecimento do patógeno na primeira linha de defesa da planta. Assim, esse marcador apresenta 5 características significativas para o estudo da resistência de plantas no patossistema Coffea - H. vastatrix. Desse modo, objetivou-se sequenciar e caracterizar uma região do genoma da principal fonte de resistência do cafeeiro à Hemileia vastatrix, o Híbrido de Timor CIFC 832/2, utilizando o marcador putative probable receptor-like protein kinase At5g39020. A identificação de genes nessa região será empregada para ampliar o conhecimento da resistência do cafeeiro a essa importante doença. 2. Material e Métodos 2.1. Rastreio e sequenciamento do clone BAC Foi feito o rastreio de uma biblioteca de clones BAC (Bacterial Artificial Chromosome), mantida no Laboratório de Biotecnologia do Cafeeiro (Universidade Federal de Viçosa – MG), com o marcador putative probable receptor-like protein kinase At5g3920. Esta biblioteca foi construída a partir do cafeeiro HdT CIFC 832/2 (CAÇÃO et al., 2013), genótipo portador de fatores genéticos que condicionam resistência a diferentes patógenos e boas características agronômicas (BETTENCOURT, 1973). A biblioteca contém 56.832 clones BAC em 148 placas de titulação de 384 poços. (CAÇÃO et al., 2013). Os clones foram replicados em placas de titulação de 384 poços contendo 70μl de meio LB fresco (com 12,5μgml-1 Cloranfenicol), usando um replicador de placas esterilizado, sob capela de fluxo de ar laminar. A multiplicação da cultura foi feita por meio da incubação das placas em agitador com temperatura de 37°C durante 18h e velocidade de 180rpm. Após a incubação, com a finalidade de identificar os clones com a marca, foi utilizada a metodologia de decomposição do agrupamento das BAC. A placa foi dividida em duas parte e coletado o pool de cada parte. Posteriormente a meia placa da biblioteca contendo o marcador foi decomposta em quatro grupos de 48 clones, seguida da análise das colunas verticais até chegar a um único clone BAC (DIOLA, 2009). O DNA plasmidial do clone foi extraído com o kit Wizard® Plus SV Minipreps DNA purification System (Promega), seguindo as recomendações do fabricante. A quantificação foi realizada com o auxílio do Qubit dsDNA BR (Life Technologies) e espectrofotômetro NanoDropTM (Thermo Fisher Scientific). A PCR foi otimizada contendo 50ng DNA plasmidial, 0,1μM de cada primer, 0,15mM de dNTP (Promega), 6 1,0mM MgCl2, 1,0U de Taq DNA polymerase (Invitrogen), e 1X PCR reação buffer, com volume final de 20μL. O DNA foi amplificado em termociclador (PTC - 200 - MJ Research and Veriti - Applied Biosystems), programado com desnaturação inicial a 94°C por 10min, seguida por 35 ciclos desnaturação a 94°C por 30s, anelamento a 61°C por 30s e extensão a 72°C por 1min. Finalizando com uma extensão final de 72°C por 10min. O produto foi visualizado em gel de agarose (1,5%). O clone identificado foi sequenciado por meio da plataforma Illumina MiSeq (paired-end reads). Para isso, 50ng de DNA plasmidial foi submetido a uma reação de fragmentação aleatória na qual o DNA foi fragmentado e ligado a adaptadores específicos utilizando o kit Nextera® XT DNA Sample Preparation (Illumina), conforme instrução do fabricante. Em seguida, o DNA purificado foi amplificado utilizando iniciadores complementares aos adaptadores. Os produtos foram quantificados por meio do espectrofotômetro Qubit DNA BR (Life Technologies). As bibliotecas foram diluídas em uma solução de Tris-HCl e Tween 0,1%, depositadas em uma flowchip e submetidas a 500 ciclos (2x250bp) de sequenciamento utilizando MiSeq Reagent Kit v2 (Illumina). 2.2. Análises de bioinformática 2.2.1. Montagem de contigs Após o sequenciamento, as reads geradas foram submetidas a análises de bioinformática para a edição, montagem e anotação dos contigs, com o intuito de interpretar o contexto biológico. Realizou-se uma avaliação de qualidade das reads sequenciadas utilizando o software FastQC (versão 0.11.5) (ANDREWS, 2010). Em seguida, foram removidas as sequências contaminantes e as de baixa qualidade por meio do software Trimmomatic (versão 0.36) (LOHSE et al., 2012). Com base nas sequências selecionadas, realizou-se a montagem dos contigs e scaffolds usando o software SPAdes (BANKEVICH et al., 2012), empregando a estratégia de montagem de novo. Efetuou-se uma avaliação de qualidade da montagem dos scaffolds utilizando a ferramenta de avaliação de montagem de genoma QUAST (versão 5.0.2) (MIKHEENKO et al., 2018). 7 2.2.2. Predição gênica Utilizando o software AUGUSTUS (http://augustus.gobics.de/), os genes foram preditos a partir dos contigs para a obtenção do número de exons, íntrons e transcritos (STANKE et al., 2004). A predição gênica foi realizada com base no reconhecimento de regiões previamente caracterizadas de Solanum lycopersicum. Essa espécie foi usada como referência por ser geneticamente próxima ao gênero Coffea e assim, compartilharem repertórios de genes comuns (LIN et al., 2005). 2.2.3. Anotação de genes A anotação dos genes foi efetuada utilizando a ferramenta para busca de similaridade de sequência, BLASTp (Basic Local Alignment Search Tool) com e-value de 10-5. Foi utilizada uma estratégia baseada em similaridade para identificar sequências relacionadas com funções já conhecidas em genoma de C. arabica (var. Caturra), C. eugenioides (NCBI - https://www.ncbi.nlm.nih.gov/) e C. canephora (clone IF 200) (COFFEE GENOME HUB - http://coffee-genome.org/). As sequências foram anotados a partir do melhor alinhamento (best hit) com cada genoma. 2.3. Análise de expressão gênica Com base na anotação gênica foram selecionadas duas sequências de genes candidatos a receptores like kinase (RLK). Para as duas sequências escolhidas foram desenhados primers utilizando o servidor GenScript (https://www.genscript.com/) e o programa Oligo Explorer (versão 1.5) (KUULASMAA, 2010). Foi desenhado um conjunto de primers para cada sequência de genes candidatos a RLK. Foram desenhados primers para o gene anotado como LRR receptor-like serine/threonine-protein kinase GSO2 (Gene1: F: 5’-TGGCGGATCAAGTGCATCT-3’; 60,3°C - R: 5’- TCGTCTCCTTGAAACTCTTGC-3’; 58,3°C; 154pb). Também foram desenhados primers para o gene anotado como putative receptor-like protein kinase At3g47110 (Gene2: F: 5’-GCCTTGGATTTGGCGATAA-3’; 56,8°C - R: 5’- CTGAGGAAGCATGAGACC-3’, 57,1°C; 143pb). Os primers desenhados foram utilizados nas reações de PCR quantitativo em tempo real (RT-qPCR). O experimento para a análise de expressão gênica foi conduzido em um delineamento experimental inteiramente casualizado, com três repetições biológicas. 8 Utilizaram-se plantas jovens C. arabica var. Caturra CIFC 19/1 (interação compatível) e Híbrido de Timor CIFC 832/1 (interação incompatível), as quais foram inoculadas com a raça XXXIII de H. vastatrix. A inoculação foi realizada como proposto por Capucho et al. (2009). Esses cafeeiros usados na análise de expressão gênica correspondem aos parentais da cultivar Oeiras MG 6851, que teve sua resistência suplantada pela raça XXXIII do patógeno. As amostras foram coletadas em 0, 12, 24 e 72 hai. Para a extração do RNA, as folhas inoculadas foram coletadas e maceradas em N2 líquido. O RNA total foi extraído com 100mg de tecido macerado e Rneasy Plant Mini Kit (Qiagen), seguindo as recomendações do fabricante. A quantificação foi realizada com o uso do espectrofotômetro Qubit RNA BR (Life Technologies) e NanoDropTM (Thermo Fisher Scientific). A integridade do RNA foi avaliada por eletroforese em gel de agarose (1,5%) corado com brometo de etídio. As amostras foram armazenadas em ultracongelamento a -80°C, até o uso. O cDNA foi sintetizado com 3μg de RNA total, pré-tratado com 1μl de DNAse por 15min (50U/μL, DNAseI de Inversão, InvitrogenTM) para remover possíveis contaminantes do DNA genômico. A primeira cadeia de cDNA foi sintetizada utilizando o kit de RT-PCR do Protocolo de Transcrição Reversa ImProm-II ™ (Promega), de acordo com as orientações do fabricante e armazenada a -20°C até a utilização. Para a realização da técnica de PCR quantitativo em tempo real, em aparelho 7500 Real Time PCR Systems (Applied Biosystems), foi utilizado o sistema de detecção de fluorescência SYBR Green I (Applied Biosystems, California, USA). Para cada reação utilizou-se 2μl da diluição da reação de síntese de cDNA de fita simples, 1μl de primers forward e reverse, 5μl de SYBR® Green PCR Master Mix (Applied Biosystems), 0,2μl de Dyer e 1μl de água estéril. Para um volume final de 10μl com 50ng/μl de cDNA e 100nM de primers. As condições da reação foram: 95°C por 10min para a desnaturação inicial, seguido por 40 ciclos de 95°C por 15s e 60°C por 1min. O nível de expressão dos genes foi calculado utilizando os valores médios de Ct, resultante de três réplicas biológicas e três réplicas técnicas. Para a normalização dos dados foram utilizados dois genes constitutivos selecionados (Ubiquitina10 e Gliceraldeído-3-fosfato desidrogenase) cujas expressões foram encontradas estáveis (CRUZ et al., 2009). As análises estatísticas foram realizadas utilizando o software Prism 5 (versão 5.01) (MOTULSKY, 2007). Todos os dados são apresentados como média. A diferença no nível de expressão entre interações em uma mesma hora de mensuração foi calculada utilizando o teste o Teste de Tukey (p 9 < 0,05). A diferença no nível de expressão entre amostras não inoculadas e amostras inoculadas foi calculada utilizando ANOVA seguida pelo Teste de Tukey (p < 0,05). 2.4. Estudos filogenéticos Foram efetuados estudos da relação genética do clone BAC selecionado (70-22F), utilizando software TopHat (versão 2.1.1) (TRAPNELL et al., 2009), em comparação com quatro genomas de Coffea: C. arabica1 var. Caturra (NCBI - https://www.ncbi.nlm.nih.gov/); C. arabica2, var. Típica (dados não publicados); C. arabica3, var. Bourbon (WCR - https://worldcoffeeresearch.org/) e Coffea canephora clone IF 200 (COFFEE GENOME HUB - http://coffee-genome.org/). No software realizou-se uma busca de identidade genética entre as reads geradas pelo sequenciamento do clone BAC 70-22F e as variedades de Coffea em estudo. Também foi realizada uma busca de similaridade de sequências (BLASTp com e-value de 10-5) entre o clone e os quatro genomas. A porcentagem de BLAST foi calculada a partir dos dois melhores alinhamentos, de cada genoma com cada sequência de contigs. Além disso, também realizaram-se análises filogenéticas baseadas em alinhamentos de cinco sequências gênicas conservadas e de cópia única do clone BAC 70-22F e dos quatro genomas de Coffea. As análises foram realizadas utilizando o software MEGA- X-10.0.5 (KUMAR et al., 2018). As cinco sequências gênicas conservadas, 3-oxoacyl- [acyl-carrier-protein] reductase 4, UDP-glucose 6-dehydrogenase 5-like, succinate- semialdehyde dehydrogenase%2C mitochondrial-like, asparagine synthetase [glutamine-hydrolyzing] e Enolase, foram escolhidas com base na anotação gênica. A história evolutiva das sequências proteicas foi inferida utilizando o método Maximum Likelihood, baseado no modelo de Tamura-Nei com bootstrap de 1.000 réplicas (FELSENSTEIN, 1985; TAMURA e NEI, 1993). Análises filogenéticas foram realizadas para os dois possíveis genes de resistência selecionados, LRR receptor-like serine/threonine-protein kinase GSO2 (Gene1) e putative receptor-like protein kinase At3g47110 (Gene2), utilizando o software MEGA- X-10.0.5 (KUMAR et al., 2018). O estudo filogenético foi efetuado com base nos melhores alinhamentos (BLASTp com e-value de 10-5) de sequências proteicas, dos dois genes com os quatro genomas de Coffea: C. arabica1 var. Caturra; C. arabica2, var. Típica; C. arabica3, var. Bourbon e Coffea canephora clone IF 200. A história evolutiva das sequências proteicas foi inferida utilizando o método Maximum 10 Likelihood, baseado no modelo de Tamura-Nei com bootstrap de 1.000 réplicas (FELSENSTEIN, 1985; TAMURA e NEI, 1993). Posteriormente, foram caracterizados os domínios das sequências proteicas do Gene1, do Gene2 e das sequências de Coffea que ficaram mais próximas na árvore filogenética desses dois genes de interesse. Essa análise foi executada no banco de dados de famílias proteicas Pfam (https://pfam.xfam.org/search/sequence) (FINN et al., 2013). 3. Resultados 3.1. Rastreio e sequenciamento do clone BAC Para caracterização de uma região genômica com potencial associação à resistência do cafeeiro, o marcador molecular capaz de amplificar o gene putative probable receptor-like protein kinase At5g39020 foi utilizado para analisar uma biblioteca de clones BAC do cafeeiro HdT CIFC 832/2 (CAÇÃO et al., 2013). Após o rastreio com o marcador, identificou-se o clone BAC 70-22F contendo a marca funcional desse gene (Figura 1). O fragmento de DNA do clone BAC 70-22F foi extraído e posteriormente sequenciado. Foram obtidas 122.273 reads de alta qualidade com o sequenciamento do clone BAC 70-22F. Figura 1. Produto de amplificação da biblioteca BAC (HdT CIFC 832/2 ). a) Marcador de peso molecular 100pb. b) Clone BAC 70-22F contendo a marca funcional do a) b) c) 11 putative probable receptor-like protein kinase At5g39020. c) Clone BAC 70-23F não apresentando a marca funcional do putative probable receptor-like protein kinase At5g39020. 3.2. Análises de bioinformática Utilizando estratégias de bioinformática, foi realizada a montagem da sequência de DNA a partir das reads de qualidade obtidas com o sequenciamento do clone BAC 70-22F. A montagem resultou em 3.355 scaffolds. A região genômica montada apresentou um valor de N50 de 1.080 pb e L50 de 605 pb, a percentagem de CG foi de 43,43 (Tabela 1). Tabela 1. Parâmetros estatísticos da montagem do clone BAC 70-22F. Características do genoma Valores Reads de alta qualidade 122.273 Número total de bases 230.817 pb Número de scaffolds 3.355 Maior scaffold 6.472 pb N50 1.080 pb L50 605 pb Número total de bases (* ≥ 0 pb) Número total de bases (* ≥ 1.000 pb) 1.080.585 pb 1.17.713 pb Número total de bases (* ≥ 5.000 pb) 24.466 pb Número total de bases (* ≥ 10.000 pb) 0 Número total de bases (* ≥ 25.000 pb) 0 Número total de bases (* ≥ 50.000 pb) 0 GC (%) 43,43 *: scaffolds; pb: pares de bases. Empregando a ferramenta para busca de similaridade de sequências (BLAST), foram anotados 991 genes a partir os genes preditos do clone BAC 70-22F. Desses genes, 340 foram anotados com similaridade com o base no genoma de C. arabica (var. Caturra), 337 com o genoma de C. eugenioides e 314 com o genoma de C. canephora (clone IF 200) (Apêndice A). Em relação aos genes anotados a partir do genoma de C. 12 arabica, 173 foram encontrados no subgenoma C. eugenioides (CE), 152 no subgenoma C. canephora (CC) e 15 com sequências não caracterizadas em cromossomos. A anotação gênica revelou a presença de genes candidatos relacionados ao mecanismo de resistência de hospedeiros contra patógenos. Foram identificados genes como um análogo ao putative late blight resistance protein homolog R1A-4, cysteine synthase, entre outros possíveis genes envolvidos no mecanismo de defesa de plantas (Apêndice A). 3.3. Análise de expressão gênica Foram selecionados dois genes análogos de resistência (RGAs), identificados na região genômica do HdT CIFC 832/2 (BAC 70-22F), para a análise de expressão. Os genes escolhidos, LRR receptor-likeserine/threonine-protein kinase GSO2 (Gene1) e putative receptor-like protein kinase At3g47110 (Gene2), são candidatos a receptores like kinase (RLK). As análises de expressão gênica mostraram resultados significativos para os dois genes selecionados do clone BAC 70-22F. Na análise da expressão do Gene1 foram observadas diferenças significativas entre interação incompatível e compatível às 12 e 24 hai (Figura 2). Na interação compatível não houve diferença de expressão quando comparados os diferentes tempos após infecção. Na interação incompatível, observou-se um aumento de expressão do gene às 12 hai, momento em que também houve diferença significativa entre as interações incompatível e compatível (Figura 2). Figura 2. Análise de expressão por PCR em tempo real do Gene1. O padrão de expressão foi mensurado em 0 hora, amostras não inoculadas, 12, 24 e 72 horas após a ** * LRR receptor-like serine/threonine-protein kinase GSO2 Interação incompatível Interação compatível 0 hai 12 hai 24 hai 72 hai 13 inoculação de urediniósporos frescos (H. vastatrix – raça XXXIII) em plantas incompatíveis (HdT CIFC 832/1) e compatíveis (C. arabica var. Caturra CIFC 19/1). (*) Diferença significativa no nível de expressão entre interações na mesma hai. (*) Diferença significativa em relação às amostras não inoculadas (0h) na mesma interação. A expressão do gene Gene2 analisado entre interações incompatível e compatível e mensurados em horários iguais de infecção, revelou diferença significativa às 0 e 72 hai. Em ambos os horários, a interação incompatível apresentou maior expressão do gene (Figura 3). Na interação incompatível houve uma diminuição da expressão relativa do Gene2 em relação ao mesmo genótipo avaliado às 0h. A interação compatível revelou um aumentou significativo de expressão do Gene2 às 24 hai (Figura 3). Figura 3. Análise de expressão por PCR em tempo real do Gene2. O padrão de expressão foi mensurado em 0 hora, amostras não inoculadas, 12, 24 e 72 horas após a inoculação de urediniósporos frescos (H. vastatrix – raça XXXIII) em plantas incompatíveis (HdT CIFC 832/1) e compatíveis (C. arabica var. Caturra CIFC 19/1). (*) Diferença significativa no nível de expressão entre interações na mesma hai. (*) Diferença significativa em relação às amostras não inoculadas (0h) na mesma interação. 3.4. Estudos filogenéticos Análises filogenéticas foram realizadas para ampliar o conhecimento do clone BAC 70-22F. As reads obtidas no sequenciamento da BAC e os quatro genomas de Coffea foram submetidas a uma busca por identidade genética. Observou- se que as sequências * * * * ** putative receptor-like protein kinase At3g47110 Interação incompatível Interação compatível 0 hai 12 hai 24 hai 72 hai 14 do clone BAC 70-22F possuem maior grau de identidade genética com o genoma de C. arabica var. Caturra (14,6%), seguida de C. arabica var. Típica (11,8%). A identidade genética com o genoma C. arabica var. Bourbon foi de 4,0 %. A menor identidade genética mensurada foi obtida em comparação com o genoma de C. canephora (0,2%) (Figura 4). Figura 4. Identidade genética entre as reads geradas pelo sequenciamento do clone BAC 70-22F e as variedades Caturra (C. arabica1), Típica (C. arabica2), Bourbon (C. arabica3) e clone IF 200 (C. canephora). Uma busca por similaridade de sequências também foi realizada entre os scaffolds montados da BAC 70-22F e os quatro genomas de Coffea. Resultado semelhante ao encontrado com as reads foi observado. Nessa análise, maior similaridade foi observada para C. arabica var. Caturra (62,56%), seguida de C. arabica var. Típica (37,15%), C. arabica var. Bourbon (0,27%) e C. canephora (0,02%) (Figura 5). 15 Figura 5. Similaridade de sequências entre o clone BAC 70-22, montado em contigs, e as variedades Caturra (C. arabica1), Típica (C. arabica2), Bourbon (C. arabica3) e clone IF 200 C. canephora. A porcentagem de BLAST foi calculada a partir dos dois melhores alinhamentos de cada genoma com cada sequência de contigs. Na caracterização do clone BAC 70-22F foram ainda analisados alguns genes conservados, cópia única, encontrados na anotação gênica. Com base na análise filogenética das sequências gênicas conservadas e dos quatro genomas de Coffea, o clone alinhou em diferentes grupos de acordo com o gene analisado (Figura 6). 16 Figura 6. Árvores filogenéticas baseadas em alinhamento dos genomas C. arabica1 var. Caturra, C. arabica2 var. Típica, C. arabica3 var. Bourbon, C. canephora clone IF 200 e de sequências gênicas conservadas do clone BAC 70-22. a) 3-oxoacyl-[acyl- carrier-protein] reductase 4 (Gene1). b) UDP-glucose 6-dehydrogenase 5-like (Gene2). c) succinate-semialdehyde dehydrogenase%2C mitochondrial-like (Gene3). d) asparagine synthetase [glutamine-hydrolyzing] (Gene4). e) Enolase (Gene5). a ) c ) d ) b ) e ) 17 Estudos filogenéticos foram efetuados para aumentar o conhecimento da possível origem dos dois genes selecionados do clone BAC 70-22F. O estudo foi baseado em alinhamentos de sequências proteicas (Apêndice B) entre os dois genes (Gene1 e Gene2) e os quatro genomas de referência do gênero Coffea (C. arabica1 var. Caturra; C. arabica2, var. Típica; C. arabica3, var. Bourbon; Coffea canephora clone IF 200) (Figuras 7 e 8). Figura 7. Árvore filogenética baseada em alinhamento de sequências proteicas. Gene1: LRR receptor-like serine/threonine-protein kinase GSO2. C. arabica1: sequências proteicas da variedade Caturra (NCBI). C. arabica2: sequências proteicas da variedade Típica (dados não publicados). C. arabica3: sequências proteicas da variedade Bourbon (WCR). C. canephora: sequências proteicas do clone IF 200 (Coffee Genome Hub). 18 Figura 8. Árvore filogenética baseada em alinhamento de sequências proteicas. Gene2: putative receptor-like protein kinase At3g47110. C. arabica1: sequências proteicas da variedade Caturra (NCBI). C. arabica2: sequências proteicas da variedade Típica (dados não publicados). C. arabica3: sequências proteicas da variedade Bourbon (WCR). C. canephora: sequências proteicas do clone IF 200 (Coffee Genome Hub). O Gene1 ficou no mesmo clado de quatro genes do genoma de C. arabica3 var. Bourbon. De acordo com a anotação gênica, esses quatro genes são putativos: LRR receptor-like serine/threonine-protein kinase GSO2 (C. arabica3 g6), uncharacterized protein LOC113703097 (C. arabica3 g7), LRR receptor-like serine/threonine-protein kinase GSO2 (C. arabica3 g8) e uncharacterized protein LOC113703097 (C. arabica3 g9) (Tabela 2). Dentro do clado, o Gene1 ficou mais próximo de um gene não caracterizado de C. arabica3 (g9) (Figura 7). Posteriormente, foi realizada a busca pelos 19 domínios proteicos das sequências desse clado utilizando o servidor Pfam. As sequências do clado, correspondentes aos cinco genomas, não apresentaram domínios proteicos caracterizados (Tabela 2). Tabela 2. Características de sequências proteicas de Coffea. Sequência proteica do Gene1 e quatro sequências proteicas agrupadas em um mesmo clado na análise filogenética. Genoma Sequência proteica Anotação Domínios BAC 70-22F Gene1 LRR receptor-like serine/threonine-protein kinase GSO2 - C. arabica3 g9-g19672.t1 uncharacterized protein LOC113703097 - C. arabica3 g8-g32952.t1 LRR receptor-like serine/threonine-protein kinase GSO2 - C. arabica3 g6-g6102.t1 LRR receptor-like serine/threonine-protein kinase GSO2 - C. arabica3 g7-g22356.t1 uncharacterized protein LOC113703097 - C. arabica3 g10-g5288.t1 uncharacterized protein LOC113703097 - O Gene2 ficou agrupado em um clado com dois genes do genoma de C. arabica2 (var. Típica) e um do genoma C. arabica1 (var. Caturra). Os genes desse clado estão anotados como: receptor-like serine threonine- kinase EFR (C. arabica2 g1), putative receptor-like protein kinase At3g47110 isoform X1 (C. arabica1 g1), receptor-like serine threonine- kinase At3g47570 (C. arabica2 g2) (Tabela 3). A partir de análises utilizando o servidor Pfam foi encontrado um domínio LRR1 na sequência proteica do Gene2. As outras três sequências do clado também apresentaram domínio LRR, mas LRR8 (Tabela 3). O gene receptor-like serine threonine- kinase EFR (C. arabica2 g1), o qual mostrou-se mais próximo do Gene2 no clado (Figura 8), além do domínio LRR8, também possui domínio Pkinase e LRRNT2 . https://blast.ncbi.nlm.nih.gov/Blast.cgi#alnHdr_XP_027080133 https://blast.ncbi.nlm.nih.gov/Blast.cgi#alnHdr_XP_027080133 20 Tabela 3. Características de sequências proteicas de Coffea. Sequência proteica do Gene2 e quatro sequências proteicas agrupadas em um mesmo clado na análise filogenética. Genoma Sequência proteica Anotação Domínios BAC 70-22F Gene2 putative receptor-like protein kinase At3g47110 LRR1 C. arabica2 (Scaffold4162HRSCAF 4163) gene-0.17 mRNA-1 receptor-like serine threonine- kinase EFR LRR8 LRRNT2 Pkinase C. arabica1 XP027093211.1 putative receptor-like protein kinase At3g47110 isoform X1 LRR8 LRRNT2 Pkinase C. arabica2 (Scaffold4162HRSCAF 4163) gene-0.13 mRNA-1 receptor-like serine threonine- kinase At3g47570 LRR8 LRRNT2 Pkinase C. arabica1 g2-XP027093214.1 probable LRR receptor-like serine/threonine-protein kinase At3g47570 LRRNT2 LRR8 LRR8 Pkinase 4. Discussão Por mio meio dos gráficos de análise de qualidade das sequências do clone BAC 70-22F, gerados pelo FastQC, observou-se que as reads obtidas pelo sequenciamento do clone BAC 70-22F apresentaram boa qualidade. O valor obtido de N50 mostra que 50% de toda a montagem está contida em scaffolds ≥ 1.080 pb. O N50 e o L50 da montagem são respectivamente a média dos maiores scaffolds até a metade do genoma (50%) e o número mínimo de scaffolds necessários para alcançar o valor N50 (GUREVICH e VYAHNI, 2013). Valores alto de N50 aumentam as chances de encontrar genes completos (LOPES, 2015; FLOREZ et al., 2017). A biblioteca BAC foi obtida a partir do cafeeiro CIFC 832/2 que corresponde a um híbrido interespecífico natural entre as espécies C. arabica e C. canephora (CAÇÃO et al., 2013). A provável origem desse híbrido tetraploide fértil é a partir da fecundação de um gameta não reduzido de C. canephora com um gameta de C. arabica e posteriores eventos de retrocruzamentos com C. arabica (BETTENCOURT, 1973; LASHERMES et al., 2000). Essa origem proposta para o HdT, corrobora para a maior similaridade de sequências encontradas entre o clone BAC e o genoma de C. arabica. 21 Entretanto, os genótipos derivados do Híbrido de Timor apresentam alta diversidade genética (SETOTAW et al., 2010). Foram anotados 173 genes em similaridade com o genoma de C. arabica. Em relação a esses genes, 173 foram encontrados no subgenoma C. eugenioides (CE), 152 no subgenoma C. canephora (CC) e 15 com sequências não caracterizadas em cromossomos. A espécie C. arabica possui dois subgenomas, pois é alotetraplóide (2n=44 cromossomos) (CLARINDO e CARVALHO, 2008) e tem origem da hibridação natural entre duas espécies diploides, C. eugenioides (2n=22 cromossomos) e C. canephora (2n=22 cromossomos) (LASHERMES et al., 1999). Estudos sobre a origem de C. arabica sustentam a hipótese de que esse genoma resulta da associação dos subgenomas CC e CE, no entanto, afirmam que há limites taxonômicos entre C. arabica e C. canephora. Análises filogenéticas apresentam as três espécies em clusters distintos, sustentados por um alto valor de bootstrap (LASHERMES et al., 1999). Foram identificados no clone BAC 70-22F genes envolvidos na modulação da defesa em diferentes etapas da infecção e genes como um análogo ao putative late blight resistance protein homolog R1A-4, que desencadeia um sistema de defesa, incluindo uma resposta hipersensível que restringe o crescimento do patógeno (HR). Também foram identificados possíveis inibidores de proteases, envolvidos na morte programada ou apoptose controlada por sinalização (cysteine synthase) (TALHINHAS et al., 2017), entre outros possíveis genes envolvidos no mecanismo de defesa de plantas (Apêndice A). Genes candidatos relacionados a mecanismos de defesa semelhantes aos apresentados nesse trabalho, foram identificados por Florez et al. (2017). O transcriptoma da interação cafeeiro-H. vastatrix, foi analisado, considerando a interação compatível (C. arabica var. Caturra CIFC 19/1 inoculado com a raça XXXIII) e incompatível (HdT CIFC 832/1 inoculado com a raça XXXIII). Regiões gênicas com funções similares também foram descritas por Barka et al. (2017). Os autores analisaram uma biblioteca subtrativa e realizaram estudos de expressão gênica durante a interação incompatível (HdT CIFC 832/2) e compatível (C. arabica cv. Catuaí IAC 44) inoculados com a raça II de H. vastatrix. Esses trabalhos sustentam a hipótese de que a região do genoma do HdT CIFC 832/2 clonada e sequenciada no presente trabalho contém genes associados à resistência à H. vastatrix. A partir da anotação dos genes presentes na região genômica do HdT CIFC 832/2 (BAC 70-22F), foram selecionados dois genes candidatos a receptores like kinase 22 (RLKs), para a análise de expressão gênica. Os RLKs são receptores de reconhecimento padrão (PRRs) que permitem a identificação de uma ampla gama de patógenos levando à PTI, constituindo a primeira linha de defesa da planta (SEKHWAL et al., 2015). O padrão de expressão do Gene1 sugere uma resistência pré-haustorial na interação incompatível, há reconhecimento do patógeno nas primeiras horas de infecção. O fungo H. vastatrix estabelece uma relação biotrófica com o seu hospedeiro em poucas horas após a inoculação, a produção de haustório ocorre logo que o fungo entra nos estômatos e, provavelmente, antes de chegar à cavidade subestomática, ou seja, aproximadamente às 24 hai (RAMIRO et al., 2009). Resistência pré-haustorial para o mesmo patossistema, genótipos resistente (HdT CIFC 832/2) e suscetível (C. arabica var. Caturra CIFC 19/1) inoculados com H. vastatrix raça XXXIII, foi observado em trabalhos de citologia (LOPES, 2015). Às 17h, após a inoculação, observaram-se as primeiras respostas citológicas induzidas pelo fungo, houve a morte celular nas células estomáticas de ambos os genótipos. Entretanto, os resultados sugerem impedimento do crescimento do fungo, no cafeeiro resistente, no estágio pré-haustorial, diferente do observado no cafeeiro suscetível. Na interação compatível, o fungo foi capaz de colonizar os tecidos do hospedeiro (LOPES, 2015). Esse padrão de expressão observado para o Gene1, também foi descrito por Diniz et al. (2012), que sugerem uma rápida resposta de resistência em genótipos com interação incompatível. Entretanto, resistência pós-haustorial é geralmente a resposta descrita para a interação cafeeiro – H. vastatrix. O fungo cessa o seu crescimento em diferentes estágios da infecção, sendo mais frequentemente após a formação do primeiro haustório (SILVA et al., 2002; RAMIRO et al., 2009). Já o padrão de expressão do Gene2, é uma diminuição da expressão no genótipo resistente que pode estar relacionada a uma resposta de defesa contra o patógeno. A maior expressão do gene pode cooperar de alguma forma com o sucesso da infecção pelo patógeno. Assim, em interações incompatíveis há a diminuição da expressão desse gene, como foi observado antes das 24 hai, sugerindo também uma defesa pré- haustorial. No genótipo suscetível observou-se um aumento da expressão do Gene2 às 24 hai, momento em que há a formação do haustório, o que pode estar permitindo maior adaptação do fungo. Padrão de expressão semelhante ao observado da expressão do Gene2 deste trabalho foi observado por BARROS (2016) em estudos do patossistema soja - Phakopsora pachyrhiz em que o fungo pode induzir respostas de defesa da planta nas horas iniciais do seu desenvolvimento, favorecendo o processo de infecção em 23 genótipos suscetíveis. No genótipo resistente vários genes foram reprimidos e no genótipo suscetível houve a indução na expressão de diferentes genes responsivos. Para que ocorra uma resposta efetiva das plantas contra determinado estresse, diversos genes devem ser ativados e vários outros devem ser reprimidos. Os genes envolvidos na defesa contra patógeno, mesmo que tenham outra função na célula vegetal, só têm aumento no nível de expressão se for pertinente, evitando gasto de energia desnecessário para a célula (SREE et al., 2015). Assim, outra hipótese para o padrão de expressão do Gene2 seria a diminuição da expressão de um gene que não auxilia nas respostas de defesa do cafeeiro durante a interação incompatível, permitindo o aumento eficiente da expressão de outros genes associados à resistência. O perfil de expressão encontrado por Florez et al. (2017), em relação aos possíveis receptores like kinase (RLK), durante a interação de Coffea com o fungo H. vastatrix, revelou que os RLKs tiveram uma diminuição na expressão relativa às 24 hai durante a interação no genótipo resistente, em relação as amostras não inoculadas. No genótipo suscetível foi observado um pico de expressão às 24h após a infecção. Os autores relataram que os genes RLKs encontrados possivelmente estão envolvidos nas primeiras respostas de defesa da planta, PTI. O mesmo foi observado para o Gene2 nesse estudo. O reconhecimento do patógeno pelos receptores das plantas desencadeia uma cascatas de sinalização para expressão de genes que resultam na PTI, em poucas horas após a infecção do fungo nas plantas (JONES e DANGL, 2006). Nos estudos filogenéticos, o percentual de identidade genética entre as reads geradas pelo sequenciamento do clone BAC 70-22F e as variedade de Coffea mostrou valores baixos em relação a porcentagem de BLAST utilizando o genoma do clone montado em contigs. Com esses valores obtidos o indicado é a utilização da estratégia de montagem de novo. Pois os genomas de Coffea utilizados não são similares o suficiente com a região genômica sequenciada do HdT CIFC 832/2 para a realização da montagem por referência. A similaridade genética entre o clone BAC 70-22F e a variedade Caturra (C. arabica1), a partir da porcentagem de BLAST entre os genomas, apresentou um valor alto em comparação com os outros resultados obtidos no alinhamento entre genomas. Já em relação à espécie C. canephora, os valores de similaridade e de identidade genética entre o clone BAC 70-22F e esse genoma apresentaram valores baixos. A análise de introgressão do genoma do HdT com os seus possíveis parentais, C. canephora var. Robusta e C. arabica, provou a existência de baixa introgressão de C. canephora no 24 HdT (SETOTAW et al., 2010). A alta similaridade genética do HdT e C. arabica foram confirmadas por análise de introgressão do genoma, estudo da diversidade genética e análise de agrupamento, sustentando a hipótese de que o HdT é resultante de pelo menos dois retrocruzamentos com C. arabica (SETOTAW et al., 2010). Além disso, o fenótipo do HdT é semelhante ao da espécie C. arabica, realizam autofecundação e contém um número tetraploide de cromossomos semelhante ao encontrado nessa espécie (HERRERA et al., 2014). Essas informações disponíveis na literatura corroboram as encontradas no presente trabalho. Entretanto, os genes de resistência (SH6-SH9) presentes no HdT, que ainda não foram suplantados (ZAMBOLIM, 2016), vieram da introgressão do genoma de C. canephora (HERRERA et al., 2014). Os resultados observados podem indicar que o genoma utilizado C. canephora (clone IF 200) e o genoma C. canephora parental do HdT (CIFC 832/2) possuem ampla diversidade genética. Pois, dentro da espécie C. canephora há uma ampla base genética resultando em uma grande diversidade genética. A espécie possui diferentes grupos varietais, os quais provavelmente descendem da var. Robusta. C. arabica e o HdT apresentam maior similaridade com os genótipos do C. canephora var. Robusta do que com var. Conilon (SOUZA, 2011). Na análise filogenética dos genes conservados, o clone alinhou em grupos diferentes de acordo com o gene estudado. Houve maior relação filogenética do clone BAC 70-22F com a variedade Boubon (C. arabica3), diferente dos dados encontrados em análises anteriores deste trabalho. No entanto, a menor similaridade foi com o genoma de C. canephora, em conformidade com resultados já apresentados. Nem sempre é possível associar a filogenia detectada por um gene com a filogenia dos organismos. Fenômenos de duplicação, deleção e recombinação podem alterar significativamente a filogenia obtida. (CALDART et al., 2016). Entretanto, as sequências utilizadas são de genes conservados e de cópia única, distribuídos em diferentes regiões do genoma do clone BAC 70-22F (HdT CIFC 832/2). Os resultados observados no estudo podem estar associados à diversidade genética apresentada pelo HdT. Setotaw et al. (2010), com o objetivo de investigar a diversidade genética do HdT, utilizando marcadores moleculares, concluíram ao analisarem 48 acessos de um banco de germoplasma, que o HdT apresenta considerável diversidade genética e ainda ampla variabilidade genética. Assim, além de ser uma importante fonte de genes para resistência a doenças, os genótipos do HdT possuem variações genéticas que são importantes no desenvolvimento de cultivares com resistência durável. 25 As árvores filogenéticas dos dois genes candidatos a RLKs, baseada no alinhamento de sequências proteicas dos genes e dos quatro genomas de Coffea, revelaram que o Gene1 e o Gene2 ficaram diferentes dos genes pertencentes ao genoma de C. canephora. Esses resultados sugerem que os dois genes pertencentes ao clone BAC 70-22F possuem relação filogenética mais próxima com os genes do genoma de C. arabica, assim como os resultados já apresentados neste trabalho. O Gene2 e as três sequências agrupadas em um mesmo clado apresentaram domínios LRR. O domínio LRR possui importante função na defesa da planta contra patógenos, tem atuação tanto na PTI quanto na ETI. Na PTI os PRR localizados na superfície da membrana celular ou no interior da célula geralmente apresentam o domínio LRR. Além disso, o domínio LRR está envolvido no reconhecimento específico de efetores de patógenos, podendo interagir com a proteína Avr ou com um complexo de proteínas formado durante o processo de infecção (RAFIQI et al., 2009; RIBAS et al., 2011). No RT-qPCR apresentado nesse trabalho, o Gene2 apresentou alta expressão na interação incompatível (0 hai) e logo nas primeiras horas após a infecção o padrão de expressão diminuiu. Esse resultado pode estar relacionado com a atuação do gene no reconhecimento do patógeno no momento inicial da infecção. O mecanismo de defesa PTI ocorre imediatamente após o contato com o patógeno e é considerada a primeira linha de defesa induzida na planta, reconhecendo padrões moleculares conservados do patógeno (JONES e DANGL, 2006). Observou-se que na interação compatível houve um aumento da expressão do Gene2 após as 24 hai, momento em que o haustório já se formou. Essa defesa tardia no genótipo suscetível possivelmente está relacionada à suscetibilidade do genótipo, corroborando a importância da atuação de proteínas que contêm o domínio LRR no reconhecimento do patógeno. 5. Conclusões As informações obtidas no presente trabalho são relevantes para ampliar o conhecimento sobre genes de resistência do cafeeiro à H. vastatrix e auxiliar na melhor compreensão da diversidade genética em genótipos do HdT. Pois, permitiram caracterizar uma região genômica do Híbrido de Timor CIFC 832/2, correspondente ao clone BAC 70-22F e potenciais genes com associação à resistência desse cafeeiro à H. vastatrix foram descritos. Dentre esses genes, dois genes se destacaram, sendo eles possíveis receptores like kinases (RLKs) com perfil de expressão correspondente a uma 26 resposta de resistência pré-haustorial. As análises de expressão gênica mostraram um perfil de expressão coerente com os já apresentados para o patossistema Coffea – H. vastatrix. As análises filogenéticas desses genes, bem como da região genômica clonada, demonstraram maior similaridade do clone BAC 70-22F com o genoma da espécie C. arabica e corroboraram a diversidade genética descrita para o HdT. 27 Referências Bibliográficas ANDREWS, S. FastQC: a quality control tool for high throughput sequence data. 2010. AUGUSTUS. Disponível em: Acesso em 20 de março de 2018. AVELINO, J.; CRISTANCHO, M.; GEORGIOU, S.; IMBACH, P.; AGUILAR, L.; BORNEMANN, G.; LÄDERACH, P.; ANZUETO, F.; HRUSKA, A.J.; MORALES, C. The coffee rust crises in Colombia and Central America (2008–2013): impacts, plausible causes and proposed solutions. Food Security, v. 7, n. 2, p. 303-321. 2015. BANKEVICH, A.; NURK, S.; ANTIPOV, D.; ANTIPOV, D.; GUREVICH, A. A.; DVORKIN, M.; KULIKOV. A.S.; LESIN, V.M.; NIKOLENKO, S.I.; PHAM, S.; PRJIBELSKI, A.D.; PYSHKIN, A.V.; SIROTKIN, A.V.; VYAHHI, N.; TESLER, G.; ALEKSEYEV, M.A.; PEVZNER, P.A. SPAdes: a new genome assembly algorithm and its applications to single-cell sequencing. Journal of computational biology, v. 19, n. 5, p. 455-477. 2012. BARKA, G. D.; CAIXETA, E. T.; de ALMEIDA, R. F.; ALVARENGA, S. M.; ZAMBOLIM, L. Differential expression of molecular rust resistance components have distinctive profiles in Coffea arabica - Hemileia vastatrix interactions. European journal of plant pathology, v. 149, n. 3, p.543-561. 2017. BARROS, V. A. Vias de sinalização mediadas por ácido salicílico e metil-jasmonato e papel de GmbZIP89 em resposta à infecção por Phakopsora pachyrhizi em genótipos contrastantes de soja. Dissertação (Mestrado em Bioquímica Aplicada) – Departamento de Bioquímica e Biologia Molecular, Universidade Federal de Viçosa, Viçosa, MG. 2016. BECK, M.; HEARD, W.; MBENGUE, M.; ROBATZEK, S. The INs and OUTs of pattern recognition receptors at the cell surface. Current opinion in plant biology, v. 15, n. 4, p. 367-374. 2012. BETTENCOURT, A. J. Considerações sobre o “Híbrido de Timor”. Campinas: Instituto Agronômico, 20p. (Circular n° 23). 1973. BETTENCOURT, A. J.; RODRIGUES JÚNIOR. C.J. Principles and practice of coffee breeding for resistance to rust and other diseases In: CLARKE, R.J. and MACRAE, R (Ed.). Coffee: Volume 4 – Agronomy. London: Elsevier Applied Science, cap. 6, p.199-234. 1988. CABRAL, P. G. C.; ZAMBOLIM, E. M.; ZAMBOLIM, L.; LELIS, T. P.; CAPUCHO, A. S & CAIXETA, E. T. Identification of a new race of Hemileia vastatrix in Brazil. Australasian Plant Disease Notes, v. 4, n. 1, p. 129–130. 2009. CAÇÃO, S. M. B; SILVA, N. V.; DOMINGUES, D. S; VIEIRA, L. G. E.; DINIZ, L. E. C.; ALVEZ, C. S. G.; ANDRADE, A. C.; CARPETIERI-PIPOLO, V.; PEREIRA, L;F.P. Construction and characterization of a BAC library from the Coffea arabica genotype Timor Hybrid CIFC 832/2. Genetica, v. 141, n. 4-6, p. 217-226. 2013. 28 CALDART, E. T.; MATA, H.; CANAL, C. W.; RAVAZZOLO, A. P. Phylogenetic analysis: basic concepts and its use as a tool for virology and molecular epidemiology. Acta Scientiae Veterinariae, 44. 2016. CAPUCHO, A. S.; CAIXETA, E. T.; ZAMBOLIM, E. M.; ZAMBOLIM, L. Herança da resistência do Híbrido de Timor UFV 443-03 à ferrugem do cafeeiro. Pesq. Agrop. Bras., Brasília. 44: 276-282. 2009. CAPUCHO, A. S.; MACIEL-ZAMBOLIM, E.; FREITAS, R.L.; HADDAD, F.; CAIXETA, E. T.; ZAMBOLIM, L. Identification of race XXXIII of Hemileia vastatrix on Coffea arabica Catimor derivatives in Brazil. Austral Plant Dis Notes, v. 7, p. 189– 191. 2012. CARVALHO, V. L.; CUNHA, R. L.; SILVA, N. R. N. Alternativas de controle de doenças do cafeeiro. Coffee Science, Lavras, v. 7, n. 1, p. 42-49, 2012. CLARINDO, W. R.; CARVALHO, C. R. First Coffea arabica karyogram showing that this species is a true allotetraploid. Plant Systematics and Evolution. Sep 1;274(3- 4):237. 2008. COFFEE GENOME HUB. Disponível em: Acesso em 20 de março de 2018. CRUZ, F.; KALAOUN, S.; NOBILE, P.; COLOMBO, C.; ALMEIDA, J.; BARROS, L.M.; ROMANO, E.; GROSSI-DE-SÁ, M.F.; VASLIN, M.; ALVES-FERREIRA, M. Evaluation of coffee reference genes for relative expression studies by quantitative real- time RT-PCR. Molecular Breeding. May 1;23(4):607-16. 2009. DINIZ, I.; TALHINHAS, P.; AZINHEIRA, H. G.; VÁRZEA, V.; MEDEIRA, C.; MAIA, I.; PETITOT, A. S.; NICOLE; M.; FERNANDEZ, D.; do CÉU SILVA, M. Cellular and molecular analyses of coffee resistance to Hemileia vastatrix and nonhost resistance to Uromyces vignae in the resistance-donor genotype HDT832/2. European journal of plant pathology. May 1;133(1):141-57. 2012. DIOLA, V. Resistência à ferrugem do cafeeiro: mapeamento genético, físico e análise da expressão gênica em resposta a infecção de H. vastatrix. Tese (Doutorado em Fisiologia Vegetal) – Departamento de Biologia Vegetal, Universidade Federal de Viçosa, Viçosa, MG. 2009. DIOLA, V.; DE BRITO, G. G.; CAIXETA, E. T.; MACIEL-ZAMBOLIM, E.; SAKIYAMA, N. S.; LOUREIRO, M. E.; High-density genetic mapping for coffee leaf rust resistance. Tree genetics & genomes, 7(6), pp.1199-1208. 2011. DODDS, P. N.; RAFIQI, M.; GAN, P. H. P.; HARDHAM, A. R.; JONES, D. A.; ELLIS, E. G. Effectores of biotrophic fungi and oomycetes: pathogenicity factors and triggers of host resistance. New Phytologist. 183: 993-1000. 2009. EDWARDS, D.; BATLEY, J. Plant bioinformatics: from genome to phenome. Trends in biotechnology, v. 22, n. 5, p. 232-237. 2004. 29 ETIENNE, H.; ANTHONY, F.; DUSSERT, S.; FERNANDEZ, D.; LASHERMES, P.; BERTRAND, B. Biotechnological applications for the improvement of coffee (Coffea arabica L.). In Vitro Cellular & Developmental Biology-Plant, v. 38, n. 2, p. 129- 138. 2002. FELSENSTEIN, J. Confidence Limits on Phylogenies: An Approach Using The Boostrap. Evolution (N Y) 39:783–791. 1985. FERNANDES-BRUM, C. N.; REZENDE, P. M.; RIBEIRO, T. H. C.; de OLIVEIRA, R. R.; de SOUZA CARDOSO, T. C.; do AMARAL, L. R. GOMES, M. S.; CHALFUN- JUNIOR, A. A genome-wide analysis of the RNA-guided silencing pathway in coffee reveals insights into its regulatory mechanisms. PloS One, v. 12, n. 4, p. e0176333. 2017. FINN, R. D.; BATEMAN, A.; CLEMENTS, J.; COGGILL, P.; EBERHARDT, R. Y.; EDDY, S. R.; HEGER, A.; HETHETINGGTON, K; HOLM, L.; MISTRY, J.; SONNHAMMER, E. L. L., TADE, J.; PUNTA, M. Pfam: the protein families database. Nucleic acids research, v. 42, n. D1, p. D222-D230. 2013. FLOR, H.H. Current status of the gene-for-gene concept. Annual review of phytopathology, v. 9, n. 1, p. 275-296. 1971. FLOREZ, J. C.; MOFATTO, L. S.; DO LIVRAMENTO, R. F. L.; FERREIRA, S. S.; ZAMBOLIM, E. M.; CARAZZOLLE, M. F.; ZAMBOLIM, L.; CAIXETA, E. T. High throughput transcriptome analysis of coffee reveals prehaustorial resistance in response to Hemileia vastatrix infection. Plant Molecular Biology, v. 95, p. 607-623. 2017. FRANTZESKAKIS, L.; DI PIETRO, A.; REP, M.; SCHIRAWSKI, J.; WU, C. H.; PANSTRUGA, R. Rapid evolution in plant–microbe interactions–a molecular genomics perspective. New Phytologist. 2019. GEN SCRIPT. Disponível em: Acesso em 26 de fevereiro de 2019. GUREVICH, A.; VYAHNI, N. QUAST: quality assessment tool for genome assemblies. Bioinformatics, v. 29, n. 8, p. 1072-1075. 2013. HEATH, M. C. Nonhost resistance and nonspecific plant defenses. Current opinion in plant biology, v. 3, n. 4, p. 315-319. 2000. HERRERA, J. C.; VILLEGAS, A. M.; GARCIA, F. A.; DEREEPER, A.; COMBES, M. C.; POSADA, H. E.; LASHERMES, P. Genomic relationships among different Timor hybrid (Coffea L.) accessions as revealed by SNP identification and RNA-Seq analysis. In: Advances in Computational Biology. Springer, Cham, p. 161-168. 2014. JONES, J. D. G.; DANGL, J. L. The plant immune system. Nature, v. 444, n. 7117, p. 323. 2006. KUULASMAA T. Oligo Explorer 1.5. University of Easter Finland, Kuopyo, Finland. 2010. 30 KUMAR, K. R. R.; KIRTI, P. B. Differential gene expression in Arachis diogoi upon interaction with peanut late leaf spot pathogen, Phaeoisariopsis personata and characterization of a pathogen induced cyclophilin. Plant Mol Biol, v. 75:497–513. 2011. KUMAR, S.; STECHER, G.; LI, M.; KNYAZ, C.; TAMURA, K. MEGA X: Molecular Evolutionary Genetics Analysis across computing platforms. Molecular Biology and Evolution, 35:1547-1549. 2018. LASHERMES, P.; COMBES, M. C.; ROBERT, J.; TROUSLOT, P.; D’HONT, A.; ANTHONY, F.; CHARRIER, A. Molecular characterisation and origin of the Coffea arabica L. genome. Molecular and General Genetics MGG, v. 261, n. 2, p. 259-266. 1999. LASHERMES, P.; ANDRZEJEWSKI, S.; BERTRAND, B.; COMBES, M. C.; DUSSERT, S.; GRAZIOSI, G.; ANTHONY, F. Molecular analysis of introgressive breeding in coffee (Coffea arabica L.). Theoretical and applied genetics, v. 100, n. 1, p. 139-146. 2000. LIN, C.; MUELLER, L. A.; CARTHY, J. M.; CROUZILLAT, D.; PETIARD, D.; TANKSLEY, S. D. Coffee and tomato share common gene repertoires as revealed by deep sequencing of seed and cherry transcripts. Theoretical and applied genetics, v. 112, n. 1, p. 114-130. 2005. LOHSE, M.; BOLGER, A. M.; NAGEL, A.; FERNIE, A. R.; LUNN, J. E.; STITT, M.; USADEL, B. R obi NA: a user-friendly, integrated software solution for RNA-Seq- based transcriptomics. Nucleic Acids Res., v. 40, n.1, p. 622-627. 2012. LOPES, R. L. F. Análise Citológica e Perfil de Expressão Gênica de Hemileia vastatrix (RaçaXXXIII) na Interação Com o Cafeeiro. Tese (Doutorado em Genética e Melhoramento) – Departamento de Fitotecnia, Universidade Federal de Viçosa, Viçosa, MG. 2015. MENDGEN, K., HAHN, M. Plant infection and the establishment of fungal biotrophy. Trends in plant science, v. 7, n. 8, p. 352-356. 2002. MICHNO, J. M.; STUPAR, R. M. The importance of genotype identity, genetic heterogeneity, and bioinformatic handling for properly assessing genomic variation in transgenic plants. BMC biotechnology, v. 18, n. 1, p. 38. 2018. MIKHEENKO, A.; PRJIBELSKI, A.; SAVELIEV, V.; ANTIPOV, D.; GUREVICH, A. Avaliação de montagem de genoma versátil com QUAST-LG. Bioinformática 34 (13): i142-i150. 2018. MOTULSKY, H. J. Prism 5 Statistics Guide, Software GraphPad. Inc., San Diego CA. 2007. NATIONAL CENTER FOR BIOTECHNOLOGY IMFORMATION. Disponível em: Acesso em 20 de março de 2018. 31 NORONHA-WAGNER, M.; BETTENCOURT, A. Genetic study of the resistance of coffea spp. to leaf rust: i. identification and behavior of four factors conditioning disease reaction in Coffea arabica to twelve physiologic races of Hemileia vastatrix. Canadian Journal of Botany, v. 45, n. 11, p. 2021-2031. 1967. PESTANA, K. N.; CAPUCHO, A. S.; CAIXETA, E. T.; DE ALMEIDA, D. P.; ZAMBOLIM, E. M.; CRUZ, C. D.; ZAMBOLIM, L.; PEREIRA, A. A.; OLIVEIRA, A. C. B.; SAKIYAMA, N. S. Inheritance study and linkage mapping of resistance loci to Hemileia vastatrix in Híbrido de Timor UFV 443-03. Tree genetics & genomes, v. 11, n. 4, p. 72. 2015. RAFIQI, M.; BERNOUX, M.; ELLIS, J. G.; DODDS, P. N. In the trenches of plant pathogen recognition: Role of NB-LRR proteins. In: Seminars in cell & developmental biology. Academic Press, p. 1017-1024. 2009. RAMIRO, D. A.; Escoute, J.; Petitot, A. S.; Nicole, M.; Maluf, M. P.; Fernandez, D. Biphasic haustorial differentiation of coffee rust (Hemileia vastatrix race II) associated with defence responses in resistant and susceptible coffee cultivars. Plant Pathology, v. 58, n. 5, p. 944-955. 2009. REDDY, A. C.; NARESH, P. The crucial role of R-genes/RGAs in host-microbial interactions and plant immunity. Research Journal of Biotechnology, vol, v. 13, p. 4. 2018. RIBAS, A. F.; CENCI, A.; COMBES, M. C.; ETIENNE, H.; LASHERMES, P. Organization and molecular evolution of a disease-resistance gene cluster in coffee trees. BMC genomics, v. 12, n. 1, p. 240. 2011. SEKHWAL, M.; LI, P.; LAM, I.; WANG, X.; CLOUTIER, S.; YOU, F. Disease resistance gene analogs (RGAs) in plants. International journal of molecular sciences, v. 16, n. 8, p. 19248-19290. 2015. SETOTAW, T. A.; TEXEIRA, C. E.; FEREIRE, P. G; ZAMBOLIM, E. M.; PEREIRA, A. A; SAKIYAMA, N. S. Breeding potential and genetic diversity of" Híbrido do Timor" coffee evaluated by molecular markers. Crop breeding and applied biotechnology, v. 10, n. 4, p. 298-304. 2010. SILVA, M. C.; NICOLE, M.; GUERRA-GUIMARÃES, L.; RODRIGUES JR, C. J. Hypersensitive cell death and post-haustorial defence responses arrest the orange rust (Hemileia vastatrix) growth in resistant coffee leaves. Physiological and Molecular Plant Pathology, v. 60, n. 4, p. 169-183. 2002. SILVA, R. A.; ZAMBOLIM, L.; CASTRO, I. S. L.; RODRIGUES, H. S.; CRUZ, C. D.; CAIXETA, E. T. The Híbrido de Timor germplasm: identification of molecular diversity and resistance sources to coffee berry disease and leaf rust. Euphytica, v. 214, n. 9, p. 153. 2018. SOUZA, F. F. Diversidade genética, estrutura populacional e mapeamento associativo em Coffea canephora. Tese (Doutorado em Genética e Melhoramento) – Departamento de Fitotecnia, Universidade Federal de Viçosa, Viçosa, MG. 2011. 32 SOUSA, T. V; CAIXETA, E. T.; ALKIMIM, E. R.; DE OLIVEIRA, A. C. B.; PEREIRA, A. A.; SAKIYAMA, N. S. JÚNIOR, M. F. R. R.; ZAMBOLIM, L. Population structure and genetic diversity of coffee progenies derived from Catuaí and Híbrido de Timor revealed by genome-wide SNP marker. Tree genetics & genomes, v. 13, n. 6, p. 124. 2017. SREE, K.; SOWJANYA; R. A. J. A. M.; MANCHIKATLA, V. Genetic engineering strategies for biotic stress tolerance in plants. In: Plant Biology and Biotechnology. Springer, New Delhi, p. 611-622. 2015. STANKE, M.; STEINKAMP, R.; WAACK, S.; MORGENSTERN, B. AUGUSTUS: a web server for gene finding in eukaryotes. Nucleic acids research, v. 32, n. suppl 2, p. W309-W312. 2004. TALHINHAS, P.; BATISTA, D.; DINIZ, I.; VIEIRA, A.; SILVA, D.N.; LOUREIRO, A., TAVERES, S.; PEREIRA, A.P.; AZINHEIRA, H. G.; GUERRERA-GUINARÃES, L.; VÁRZEA, V.; SILVA, M. C. The coffee leaf rust pathogen Hemileia vastatrix: one and a half centuries around the tropics. Molecular plant pathology, v. 18, n. 8, p. 1039-1051. 2017. TAMURA, K.; NEI, M. Estimation of the number of nucleotide substitutions in the control region of mitochondrial DNA in humans and chimpanzees. Mol Biol Evol. 1993. TRAPNELL, C.; PACHTER, L.; SALZBERG, S. L. TopHat: discovering splice junctions with RNA-Seq. Bioinformatics, v. 25, n. 9, p. 1105-1111. 2009. ZAMBOLIM, L. Current status and management of coffee leaf rust in Brazil. Tropical Plant Pathology, v. 41, n. 1, p. 1-8. 2016. WORLD COFFEE RESEARCH. Disponível em: <(https://worldcoffeeresearch.org/> Acesso em 20 de março de 2018. 33 ORFs Locos Genoma %ID E-value Cobertura Anotação NODE_1_length_6472_cov_8.48366:g1.t1 NC_039902.1 3c C. arabica 49.55 0.0 98.00 uncharacterized protein LOC113735882 NODE_1_length_6472_cov_8.48366:g1.t1 chr10 C. canephora 32.48 4,00E-26 15.00 Putative Probable LRR receptor-like serine/threonine-protein kinase At4g08850 NODE_1_length_6472_cov_8.48366:g1.t1 NC_040035.1 1eu C. eugenioides 61.85 0.0 60.00 uncharacterized protein LOC113769237 NODE_1_length_6472_cov_8.48366:g1.t2 NC_039902.1 3c C. arabica 57.96 0.0 61.00 uncharacterized protein LOC113735882 NODE_1_length_6472_cov_8.48366:g1.t2 chr10 C. canephora 32.48 5,00E-26 15.00 Putative Probable LRR receptor-like serine/threonine-protein kinase At4g08850 NODE_1_length_6472_cov_8.48366:g1.t2 NC_040035.1 1eu C. eugenioides 62.34 0.0 61.00 uncharacterized protein LOC113769237 NODE_2_length_6312_cov_4.20642:g2.t1 NC_039915.1 9e C. arabica 75.38 1,00E-60 57.00 uncharacterized protein LOC113709996 NODE_2_length_6312_cov_4.20642:g2.t1 chr0 C. canephora 58.33 8,00E-18 31.00 Hypothetical protein NODE_2_length_6312_cov_4.20642:g2.t1 NC_040037.1 3eu C. eugenioides 73.61 9,00E-28 31.00 uncharacterized protein LOC113766718 NODE_10_length_2753_cov_2.94619:g8.t1 NC_039902.1 3c C. arabica 65.03 0.0 95.00 uncharacterized protein LOC113735882 NODE_10_length_2753_cov_2.94619:g8.t1 chr10 C. canephora 36.55 5,00E-27 25.00 Putative Probable LRR receptor-like serine/threonine-protein kinase At4g08850 NODE_10_length_2753_cov_2.94619:g8.t1 NC_040036.1 2eu C. eugenioides 73.94 0.0 56.00 uncharacterized protein LOC113760043 NODE_12_length_2445_cov_5.93412:g9.t1 NC_039901.1 2e C. arabica 61.18 1,00E-25 36.00 uncharacterized protein LOC113729084 NODE_12_length_2445_cov_5.93412:g9.t1 NC_040036.1 2eu C. eugenioides 61.18 6,00E-26 36.00 uncharacterized protein LOC113759824 NODE_17_length_2074_cov_4.61592:g10.t1 NC_039915.1 9e C. arabica 40.62 3,00E-40 44.00 uncharacterized protein LOC113709957 NODE_17_length_2074_cov_4.61592:g10.t1 NW_020863778.1 scaffold C. eugenioides 42.55 2,00E-40 37.00 uncharacterized protein LOC113757670 NODE_17_length_2074_cov_4.61592:g10.t2 NC_039915.1 9e C. arabica 40.62 2,00E-40 45.00 uncharacterized protein LOC113709957 NODE_17_length_2074_cov_4.61592:g10.t2 NW_020863778.1 scaffold C. eugenioides 42.55 2,00E-40 37.00 uncharacterized protein LOC113757670 NODE_24_length_1689_cov_2.3995:g13.t1 NC_039914.1 9c C. arabica 84.11 5,00E-84 53.00 serologically defined colon cancer antigen 8 homolog NODE_24_length_1689_cov_2.3995:g13.t1 NC_040035.1 1eu C. eugenioides 60.56 4,00E-54 64.00 uncharacterized protein LOC113770239 NODE_24_length_1689_cov_2.3995:g13.t2 NC_039914.1 9c C. arabica 84.11 1,00E-83 52.00 serologically defined colon cancer antigen 8 homolog NODE_24_length_1689_cov_2.3995:g13.t2 NC_040035.1 1eu C. eugenioides 60.56 8,00E-54 63.00 uncharacterized protein LOC113770239 NODE_29_length_1476_cov_2.56469:g16.t1 NC_039903.1 3e C. arabica 58.70 9,00E-167 100.00 uncharacterized protein LOC113737292 NODE_29_length_1476_cov_2.56469:g16.t1 NC_040044.1 10eu C. eugenioides 60.22 7,00E-170 100.00 uncharacterized protein LOC113750488 NODE_29_length_1476_cov_2.56469:g16.t2 NC_039903.1 3e C. arabica 58.70 1,00E-166 97.00 uncharacterized protein LOC113737292 NODE_29_length_1476_cov_2.56469:g16.t2 NC_040044.1 10eu C. eugenioides 60.22 2,00E-169 97.00 uncharacterized protein LOC113750488 NODE_44_length_1234_cov_3.88678:g21.t1 NC_039899.1 1e C. arabica 71.78 0.0 100.00 uncharacterized protein LOC113692421 NODE_44_length_1234_cov_3.88678:g21.t1 NC_040035.1 1eu C. eugenioides 72.26 0.0 100.00 uncharacterized protein LOC113768532 NODE_61_length_936_cov_2.05937:g27.t1 NC_039905.1 4e C. arabica 71.88 4,00E-88 100.00 protein STRICTOSIDINE SYNTHASE-LIKE 12-like isoform X2 Apêndice A. Anotação gênica do clone BAC 70-22F utilizando a ferramenta BLAST. Foram anotados 991 genes. 340 genes anotados em similaridade com C. arabica (var. Caturra). 337 genes anotados em similaridade com C. eugenioides. 314 genes anotados em similaridade com C.canephora (clone IF 200). 34 NODE_61_length_936_cov_2.05937:g27.t1 chr4 C. canephora 69.79 1,00E-81 100.00 Putative Strictosidine synthase 1 NODE_61_length_936_cov_2.05937:g27.t1 NC_040038.1 4eu C. eugenioides 61.83 2,00E-69 96.00 protein STRICTOSIDINE SYNTHASE-LIKE 11-like NODE_61_length_936_cov_2.05937:g27.t2 NC_039905.1 4e C. arabica 72.41 6,00E-96 93.00 protein STRICTOSIDINE SYNTHASE-LIKE 12-like isoform X2 NODE_61_length_936_cov_2.05937:g27.t2 chr4 C. canephora 69.95 1,00E-82 88.00 Putative Strictosidine synthase 1 NODE_61_length_936_cov_2.05937:g27.t2 NC_040038.1 4eu C. eugenioides 61.38 5,00E-71 87.00 protein STRICTOSIDINE SYNTHASE-LIKE 11-like NODE_62_length_907_cov_1.42651:g28.t1 NC_039912.1 8e C. arabica 80.62 4,00E-48 100.00 uncharacterized protein LOC113704544 NODE_62_length_907_cov_1.42651:g28.t1 chr0 C. canephora 67.16 2,00E-28 53.00 Hypothetical protein NODE_62_length_907_cov_1.42651:g28.t1 NW_020864190.1 scaffold C. eugenioides 76.98 2,00E-47 100.00 uncharacterized protein LOC113758088 NODE_74_length_772_cov_1.49784:g29.t1 NC_039904.1 4c C. arabica 100.00 1,00E-42 90.00 diphthine methyltransferase homolog NODE_74_length_772_cov_1.49784:g29.t1 chr4 C. canephora 100.00 4,00E-43 90.00 Putative WD repeat-containing protein 85 homolog NODE_74_length_772_cov_1.49784:g29.t1 NC_040038.1 4eu C. eugenioides 100.00 4,00E-43 90.00 diphthine methyltransferase homolog isoform X2 NODE_88_length_724_cov_1.32921:g35.t1 NC_039913.1 8c C. arabica 58.33 9,00E-59 96.00 delta-aminolevulinic acid dehydratase%2C chloroplastic-like NODE_88_length_724_cov_1.32921:g35.t1 chr8 C. canephora 58.33 3,00E-58 96.00 Delta-aminolevulinic acid dehydratase%2C chloroplastic NODE_88_length_724_cov_1.32921:g35.t1 NC_040038.1 4eu C. eugenioides 58.33 5,00E-59 96.00 delta-aminolevulinic acid dehydratase%2C chloroplastic-like NODE_95_length_683_cov_1.15347:g39.t1 NW_020850478.1 scaffold C. arabica 48.78 5,00E-27 50.00 monothiol glutaredoxin-S7%2C chloroplastic NODE_95_length_683_cov_1.15347:g39.t1 chr7 C. canephora 48.78 1,00E-26 50.00 Uncharacterized monothiol glutaredoxin ycf64-like NODE_95_length_683_cov_1.15347:g39.t1 NC_040045.1 11eu 11eu C. eugenioides 48.78 3,00E-27 50.00 monothiol glutaredoxin-S7%2C chloroplastic NODE_100_length_671_cov_1.90741:g42.t1 NC_039901.1 2e C. arabica 54.69 1,00E-18 44.00 glycine-rich protein 2-like NODE_100_length_671_cov_1.90741:g42.t1 chr2 C. canephora 54.69 5,00E-19 44.00 Glycine-rich protein 2b NODE_100_length_671_cov_1.90741:g42.t1 NC_040036.1 2eu C. eugenioides 54.69 8,00E-19 44.00 glycine-rich protein 2 NODE_104_length_660_cov_1.56261:g43.t1 NC_039904.1 4c C. arabica 35.41 7,00E-29 95.00 aldehyde dehydrogenase family 2 member B4%2C mitochondrial-like NODE_104_length_660_cov_1.56261:g43.t1 chr4 C. canephora 35.41 2,00E-29 95.00 Aldehyde dehydrogenase family 2 member B4%2C mitochondrial NODE_104_length_660_cov_1.56261:g43.t1 NC_040038.1 4eu C. eugenioides 35.41 6,00E-29 95.00 aldehyde dehydrogenase family 2 member B4%2C mitochondrial-like NODE_105_length_656_cov_1.3886:g44.t1 NC_039903.1 3e C. arabica 38.02 2,00E-21 93.00 carboxyl-terminal-processing peptidase 2%2C chloroplastic-like isoform X1 NODE_105_length_656_cov_1.3886:g44.t1 chr3 C. canephora 38.54 3,00E-23 93.00 Carboxyl-terminal-processing protease NODE_105_length_656_cov_1.3886:g44.t1 NC_040037.1 3eu C. eugenioides 38.54 4,00E-22 93.00 carboxyl-terminal-processing peptidase 2%2C chloroplastic isoform X1 NODE_110_length_645_cov_1.68486:g49.t1 NC_039903.1 3e C. arabica 57.38 2,00E-17 75.00 uncharacterized protein LOC113737438 NODE_110_length_645_cov_1.68486:g49.t1 NC_040041.1 7eu C. eugenioides 53.97 1,00E-17 77.00 uncharacterized protein LOC113777170 NODE_117_length_632_cov_2.09009:g53.t1 NC_039907.1 5c C. arabica 29.58 3,00E-15 90.00 probable lipid-A-disaccharide synthase%2C mitochondrial isoform X2 NODE_117_length_632_cov_2.09009:g53.t1 chr5 C. canephora 29.44 6,00E-16 90.00 Putative Lipid-A-disaccharide synthase NODE_117_length_632_cov_2.09009:g53.t1 NC_040039.1 5eu C. eugenioides 29.11 5,00E-15 90.00 probable lipid-A-disaccharide synthase%2C mitochondrial isoform X1 NODE_118_length_632_cov_1.58378:g54.t1 NC_039907.1 5c C. arabica 22.83 2,00E-10 96.00 DUF21 domain-containing protein At1g55930%2C chloroplastic-like isoform X3 NODE_118_length_632_cov_1.58378:g54.t1 chr5 C. canephora 23.74 4,00E-10 87.00 DUF21 domain-containing protein At1g55930%2C chloroplastic NODE_118_length_632_cov_1.58378:g54.t1 NC_040039.1 5eu C. eugenioides 25.73 9,00E-11 76.00 putative DUF21 domain-containing protein At3g13070%2C chloroplastic isoform X2 35 NODE_128_length_614_cov_1.73557:g61.t1 NC_039911.1 7e C. arabica 27.73 8,00E-08 99.00 cellulose synthase A catalytic subunit 5 [UDP-forming]-like NODE_128_length_614_cov_1.73557:g61.t1 chr7 C. canephora 27.98 1,00E-09 98.00 Cellulose synthase A catalytic subunit 5 [UDP-forming] NODE_128_length_614_cov_1.73557:g61.t1 NC_040041.1 7eu C. eugenioides 27.73 4,00E-08 99.00 cellulose synthase A catalytic subunit 5 [UDP-forming]-like NODE_129_length_613_cov_2.95522:g62.t1 NC_039905.1 4e C. arabica 98.40 6,00E-54 100.00 homeobox protein knotted-1-like 1 NODE_129_length_613_cov_2.95522:g62.t1 chr4 C. canephora 100.00 1,00E-45 86.00 Putative uncharacterized protein NODE_129_length_613_cov_2.95522:g62.t1 NC_040038.1 4eu C. eugenioides 98.40 3,00E-54 100.00 homeobox protein knotted-1-like 1 NODE_132_length_607_cov_3.49811:g65.t1 NC_039904.1 4c C. arabica 93.10 3,00E-48 97.00 uncharacterized protein LOC113739892 isoform X1 NODE_132_length_607_cov_3.49811:g65.t1 chr4 C. canephora 93.10 1,00E-48 97.00 unknown protein%3B FUNCTIONS IN NODE_132_length_607_cov_3.49811:g65.t1 NC_040038.1 4eu C. eugenioides 93.10 2,00E-48 97.00 uncharacterized protein LOC113768344 isoform X1 NODE_132_length_607_cov_3.49811:g65.t2 NC_039904.1 4c C. arabica 100.00 8,00E-48 100.00 uncharacterized protein LOC113739892 isoform X1 NODE_132_length_607_cov_3.49811:g65.t2 chr4 C. canephora 100.00 3,00E-48 100.00 unknown protein%3B FUNCTIONS IN NODE_132_length_607_cov_3.49811:g65.t2 NC_040038.1 4eu C. eugenioides 100.00 4,00E-48 100.00 uncharacterized protein LOC113768344 isoform X1 NODE_140_length_596_cov_1.30829:g70.t1 NC_039908.1 6c C. arabica 29.65 3,00E-21 93.00 thioredoxin reductase NTRC-like NODE_140_length_596_cov_1.30829:g70.t1 chr6 C. canephora 29.65 9,00E-22 93.00 NADPH-dependent thioredoxin reductase 3 NODE_140_length_596_cov_1.30829:g70.t1 NC_040040.1 6eu C. eugenioides 29.65 5,00E-22 93.00 thioredoxin reductase NTRC NODE_144_length_589_cov_2.50195:g74.t1 NC_039918.1 11c C. arabica 29.56 2,00E-16 98.00 spermidine synthase-like NODE_144_length_589_cov_2.50195:g74.t1 chr2 C. canephora 25.47 4,00E-12 96.00 Spermine synthase NODE_144_length_589_cov_2.50195:g74.t1 NC_040045.1 11eu 11eu C. eugenioides 28.93 7,00E-16 98.00 spermidine synthase NODE_146_length_588_cov_1.42661:g76.t1 NC_039898.1 1c C. arabica 36.95 5,00E-31 95.00 lysosomal beta glucosidase-like NODE_146_length_588_cov_1.42661:g76.t1 chr1 C. canephora 36.95 2,00E-31 95.00 Putative Lysosomal beta glucosidase NODE_146_length_588_cov_1.42661:g76.t1 NC_040035.1 1eu C. eugenioides 37.50 7,00E-31 89.00 lysosomal beta glucosidase-like NODE_154_length_576_cov_1.46894:g81.t1 NC_039900.1 2c C. arabica 27.98 1,00E-16 91.00 ATP-dependent DNA helicase SRS2-like protein At4g25120 isoform X3 NODE_154_length_576_cov_1.46894:g81.t1 chr0 C. canephora 27.98 5,00E-17 91.00 Putative ATP-dependent DNA helicase pcrA NODE_154_length_576_cov_1.46894:g81.t1 NC_040035.1 1eu C. eugenioides 27.98 3,00E-17 91.00 ATP-dependent DNA helicase SRS2-like protein At4g25120 NODE_168_length_551_cov_1.50422:g90.t1 NC_039910.1 7c C. arabica 36.75 4,00E-14 59.00 ATP-dependent 6-phosphofructokinase 5%2C chloroplastic-like NODE_168_length_551_cov_1.50422:g90.t1 chr7 C. canephora 36.75 1,00E-14 59.00 6-phosphofructokinase 5%2C chloroplastic NODE_168_length_551_cov_1.50422:g90.t1 NC_040041.1 7eu C. eugenioides 36.75 2,00E-14 59.00 ATP-dependent 6-phosphofructokinase 5%2C chloroplastic NODE_172_length_548_cov_3.2017:g92.t1 NC_039905.1 4e C. arabica 95.45 1,00E-24 100.00 uncharacterized protein LOC113742131 isoform X1 NODE_172_length_548_cov_3.2017:g92.t1 chr4 C. canephora 95.45 4,00E-25 100.00 unknown protein%3B FUNCTIONS IN NODE_172_length_548_cov_3.2017:g92.t1 NC_040038.1 4eu C. eugenioides 95.45 9,00E-25 100.00 uncharacterized protein LOC113768344 isoform X2 NODE_173_length_548_cov_1.32696:g93.t1 NC_039915.1 9e C. arabica 100.00 2,00E-100 100.00 uncharacterized protein LOC113709986 NODE_173_length_548_cov_1.32696:g93.t1 chr2 C. canephora 53.30 2,00E-46 100.00 Putative DNA helicase PIF1%2C ATP-dependent NODE_173_length_548_cov_1.32696:g93.t1 NC_040038.1 4eu C. eugenioides 100.00 5,00E-99 100.00 uncharacterized protein LOC113769142 NODE_174_length_548_cov_1.52654:g94.t1 NC_039910.1 7c C. arabica 81.87 5,00E-110 100.00 uncharacterized protein LOC113699534 36 NODE_174_length_548_cov_1.52654:g94.t1 chr10 C. canephora 40.00 6,00E-14 35.00 Putative Probable LRR receptor-like serine/threonine-protein kinase At4g08850 NODE_174_length_548_cov_1.52654:g94.t1 NW_020862338.1 scaffold C. eugenioides 54.95 5,00E-74 100.00 uncharacterized protein LOC113756011 NODE_175_length_546_cov_1.54371:g95.t1 NC_039900.1 2c C. arabica 34.57 3,00E-08 79.00 LOW QUALITY PROTEIN: CLP protease regulatory subunit CLPX1%2C mitochondrial-like NODE_175_length_546_cov_1.54371:g95.t1 chr2 C. canephora 34.57 7,00E-09 79.00 ATP-dependent Clp protease ATP-binding subunit ClpX NODE_175_length_546_cov_1.54371:g95.t1 NC_040036.1 2eu C. eugenioides 34.57 2,00E-08 79.00 CLP protease regulatory subunit CLPX1%2C mitochondrial NODE_176_length_545_cov_2.76282:g96.t1 NC_039900.1 2c C. arabica 67.39 7,00E-38 100.00 uncharacterized protein LOC113723844 NODE_176_length_545_cov_2.76282:g96.t1 chr2 C. canephora 49.45 3,00E-21 97.00 Putative Pol-polyprotein NODE_176_length_545_cov_2.76282:g96.t1 NC_040035.1 1eu C. eugenioides 67.39 4,00E-37 100.00 uncharacterized protein K02A2.6-like NODE_185_length_535_cov_1.33188:g100.t1 NC_039900.1 2c C. arabica 39.60 9,00E-18 93.00 3-methyl-2-oxobutanoate hydroxymethyltransferase 2%2C mitochondrial-like isoform X2 NODE_185_length_535_cov_1.33188:g100.t1 chr2 C. canephora 39.24 9,00E-18 98.00 3-methyl-2-oxobutanoate hydroxymethyltransferase NODE_185_length_535_cov_1.33188:g100.t1 NC_040036.1 2eu C. eugenioides 39.60 6,00E-18 93.00 3-methyl-2-oxobutanoate hydroxymethyltransferase 2%2C mitochondrial-like isoform X2 NODE_186_length_534_cov_1.5186:g101.t1 NC_039918.1 11c C. arabica 47.50 1,00E-17 64.00 probable aquaporin NIP-type NODE_186_length_534_cov_1.5186:g101.t1 chr7 C. canephora 42.50 2,00E-16 64.00 Probable aquaporin NIP-type NODE_186_length_534_cov_1.5186:g101.t1 NC_040036.1 2eu C. eugenioides 45.57 2,00E-17 63.00 aquaporin NIP1-1-like NODE_189_length_533_cov_1.01096:g103.t1 NC_039906.1 5e C. arabica 29.38 7,00E-11 90.00 aconitate hydratase%2C cytoplasmic NODE_189_length_533_cov_1.01096:g103.t1 chr5 C. canephora 29.38 3,00E-11 90.00 Aconitate hydratase 2%2C mitochondrial NODE_189_length_533_cov_1.01096:g103.t1 NC_040039.1 5eu C. eugenioides 27.93 1,00E-10 92.00 putative aconitate hydratase%2C cytoplasmic NODE_192_length_532_cov_1.53407:g106.t1 NW_020849470.1 scaffold C. arabica 100.00 2,00E-108 100.00 uncharacterized protein LOC113720575 NODE_192_length_532_cov_1.53407:g106.t1 chr3 C. canephora 58.94 5,00E-58 85.00 Hypothetical protein NODE_192_length_532_cov_1.53407:g106.t1 NC_040038.1 4eu C. eugenioides 98.30 6,00E-107 100.00 uncharacterized protein LOC113769142 NODE_204_length_525_cov_1.18973:g116.t1 NC_039918.1 11c C. arabica 36.97 3,00E-09 72.00 LOW QUALITY PROTEIN: inorganic phosphate transporter 2-1%2C chloroplastic-like NODE_204_length_525_cov_1.18973:g116.t1 chr11 C. canephora 41.76 8,00E-09 54.00 Inorganic phosphate transporter 2-1%2C chloroplastic NODE_204_length_525_cov_1.18973:g116.t1 NC_040045.1 11eu 11eu C. eugenioides 36.89 6,00E-09 62.00 inorganic phosphate transporter 2-1%2C chloroplastic NODE_207_length_522_cov_1.56404:g117.t1 NC_039916.1 10e C. arabica 58.82 9,00E-58 100.00 protein translocase subunit SECA2%2C chloroplastic-like NODE_207_length_522_cov_1.56404:g117.t1 chr10 C. canephora 58.82 1,00E-59 100.00 Protein translocase subunit SECA2%2C chloroplastic NODE_207_length_522_cov_1.56404:g117.t1 NC_040035.1 1eu C. eugenioides 66.23 3,00E-60 92.00 protein translocase subunit SecA%2C chloroplastic NODE_211_length_520_cov_1.92325:g121.t1 NC_039898.1 1c C. arabica 44.44 2,00E-07 36.00 phosphomethylpyrimidine synthase%2C chloroplastic isoform X3 NODE_211_length_520_cov_1.92325:g121.t1 chr1 C. canephora 44.44 8,00E-08 36.00 Phosphomethylpyrimidine synthase%2C chloroplastic NODE_211_length_520_cov_1.92325:g121.t1 NC_040035.1 1eu C. eugenioides 44.44 1,00E-07 36.00 phosphomethylpyrimidine synthase%2C chloroplastic isoform X3 NODE_213_length_518_cov_1.67574:g123.t1 NC_039909.1 6e C. arabica 42.20 5,00E-23 94.00 iron-sulfur assembly protein IscA-like 2%2C mitochondrial isoform X1 NODE_213_length_518_cov_1.67574:g123.t1 chr6 C. canephora 40.37 7,00E-23 94.00 Iron-sulfur assembly protein IscA-like 2%2C mitochondrial NODE_213_length_518_cov_1.67574:g123.t1 NC_040040.1 6eu C. eugenioides 41.28 4,00E-23 94.00 iron-sulfur assembly protein IscA-like 2%2C mitochondrial NODE_216_length_517_cov_1.84091:g125.t1 NC_039910.1 7c C. arabica 79.49 8,00E-15 37.00 uncharacterized protein LOC113699907 NODE_216_length_517_cov_1.84091:g125.t1 NC_040042.1 8eu C. eugenioides 76.92 1,00E-12 37.00 uncharacterized protein LOC113780732 37 NODE_217_length_515_cov_1.00457:g126.t1 NC_039900.1 2c C. arabica 37.97 1,00E-31 99.00 probable tRNA N6-adenosine threonylcarbamoyltransferase%2C mitochondrial NODE_217_length_515_cov_1.00457:g126.t1 chr2 C. canephora 37.97 3,00E-32 99.00 Putative Probable tRNA threonylcarbamoyladenosine biosynthesis protein osgepl1 NODE_217_length_515_cov_1.00457:g126.t1 NC_040036.1 2eu C. eugenioides 37.97 7,00E-32 99.00 probable tRNA N6-adenosine threonylcarbamoyltransferase%2C mitochondrial NODE_222_length_512_cov_3.11034:g130.t1 NC_039909.1 6e C. arabica 84.62 1,00E-95 99.00 uncharacterized protein LOC113696749 NODE_222_length_512_cov_3.11034:g130.t1 chr7 C. canephora 64.71 9,00E-08 20.00 Putative Late blight resistance protein R1 NODE_222_length_512_cov_3.11034:g130.t1 NW_020864084.1 scaffold C. eugenioides 84.62 3,00E-95 99.00 uncharacterized protein LOC113758021 NODE_228_length_508_cov_1.34339:g133.t1 chr2 C. canephora 34.57 5,00E-08 98.00 Putative Epimerase family protein slr1223 NODE_228_length_508_cov_1.34339:g133.t1 NC_040036.1 2eu C. eugenioides 34.57 1,00E-07 98.00 epimerase family protein SDR39U1 homolog%2C chloroplastic isoform X1 NODE_233_length_505_cov_1.89019:g135.t1 NC_039902.1 3c C. arabica 42.01 4,00E-33 98.00 probable uridine nucleosidase 2 isoform X1 NODE_233_length_505_cov_1.89019:g135.t1 chr3 C. canephora 42.01 2,00E-33 98.00 Probable uridine nucleosidase 2 NODE_233_length_505_cov_1.89019:g135.t1 NC_040037.1 3eu C. eugenioides 42.60 1,00E-33 98.00 probable uridine nucleosidase 2 NODE_235_length_503_cov_1.07981:g137.t1 NC_039900.1 2c C. arabica 55.38 1,00E-38 77.00 glutamate synthase [NADH]%2C amyloplastic-like isoform X2 NODE_2