DANÚBIA RODRIGUES ALVES
CARACTERIZAÇÃO DE UMA REGIÃO GENÔMICA DO
HÍBRIDO DE TIMOR CIFC 832/2 ASSOCIADA À
RESISTÊNCIA À Hemileia vastatrix
Dissertação apresentada à Universidade
Federal de Viçosa, como parte das
exigências do Programa de Pós-
Graduação em Genética e Melhoramento,
para obtenção do título de Magister
Scientiae.
VIÇOSA
MINAS GERAIS - BRASIL
2019
Ficha catalográfica preparada pela Biblioteca Central da Universidade
Federal de Viçosa - Câmpus Viçosa
T
Alves, Danúbia Rodrigues, 1992-
A474c
2019
Caracterização de uma região genômica do híbrido de timor
CIFC 832/2 associada à resistência à Hemileia vastatrix /
Danúbia Rodrigues Alves. – Viçosa, MG, 2019.
ix, 65 f. : il. (algumas color.) ; 29 cm.
Inclui apêndices.
Orientador: Eveline Teixeira Caixeta.
Dissertação (mestrado) - Universidade Federal de Viçosa.
Referências bibliográficas: f. 27-32.
1. Bioinformática. 2. Ferrugem-do-cafeeiro.
3. Sequenciamento de nucleotídeo. I. Universidade Federal de
Viçosa. Departamento de Biologia Geral. Programa de
Pós-Graduação em Genética e Melhoramento. II. Título.
CDD 22. ed. 570.285
ii
A Deus, por guiar meus passos,
Aos meus pais, Irene e Pedro,
E ao Arthur,
Por todo amor e dedicação,
Dedico
iii
AGRADECIMENTOS
A Deus, por iluminar o meu caminho.
Aos meus pais, Irene e Pedro, por todo amor e por acreditarem nos meus sonhos.
À minha família e aos amigos que mesmo de longe estiveram presentes no meu
coração.
Ao Arthur pelo carinho, companheirismo, compreensão e incentivo. Com você
ao meu lado o caminho se tornou mais fácil.
À Universidade Federal de Viçosa e ao Programa de Pós Graduação em
Genética e Melhoramento, pela qualidade do ensino.
Ao Instituto de Biotecnologia Aplicada à Agropecuária (BIOAGRO), pela
infraestrutura disponibilizada à realização do trabalho.
À minha orientadora, Dra. Eveline Teixeira Caixeta, pelos ensinamentos,
confiança e incentivo.
À minha coorientadora Dra. Dênia Pires de Almeida pelos ensinamentos
transmitidos, pela dedicação na realização desse trabalho e pela amizade.
Ao meu coorientador Prof. Tiago Antônio de Oliveira Mendes pelo apoio, pela
disponibilidade e pelas contribuições para essa dissertação.
À Dra. Gilza Barcelos de Souza pelas contribuições para a melhoria dessa
dissertação.
À Dra. Poliane Marcele Ribeiro Cardoso e ao Dr. Antonio Carlos Baião de
Oliveira, pela disponibilidade de participação na banca.
Aos amigos que são a minha família em Viçosa, por dividirem comigo o medos
e também os bons momentos. Em especial a minha companheira de mestrado, Ruane.
Aos amigos do Biocafé pelo apoio, pela amizade e por tornarem os meus dias
mais agradáveis.
À Samila, ao Pedro e ao Edson pelas contribuições neste trabalho.
À Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES),
pela concessão da bolsa de mestrado.
Aos secretários do PPGGM, Marco Túlio e Odilon, pela dedicação e boa
vontade em nos ajudar.
A todos que de alguma forma contribuíram para a minha formação pessoal e
profissional. Meus sinceros agradecimentos.
iv
“A persistência é o menor caminho do êxito.”
Charles Chaplin
v
RESUMO
ALVES, Danúbia Rodrigues, M.Sc., Universidade Federal de Viçosa, julho de 2019.
Caracterização de uma região genômica do Híbrido de Timor CIFC 832/2
associada à resistência à Hemileia vastatrix. Orientadora: Eveline Teixeira Caixeta.
Coorientadores: Dênia Pires de Almeida e Tiago Antônio de Oliveira Mendes.
A ferrugem do cafeeiro, causada pelo fungo biotrófico Hemileia vastatrix é a principal
doença de importância econômica dessa cultura, sendo responsável por grandes
prejuízos à cafeicultura mundial. Novas raças do patógeno têm surgido infectando
cultivares de café comercializados como resistentes a essa doença. Desse modo, devido
ao alto potencial adaptativo do fungo, a busca por cafeeiros resistentes a essa doença é
uma atividade recorrente nos programas de melhoramento. Estudos com o Híbrido de
Timor (HdT), tem sido realizados em pesquisas que visam resistência durável à
ferrugem e outras doenças do cafeeiro. Compreender a natureza da resistência
duradoura em genótipos do HdT e descrever os genes envolvidos na defesa das plantas é
fundamental para o uso eficiente dos recursos disponíveis nesse híbrido natural. A
utilização de ferramentas moleculares e de bioinformática tem mostrado resultados
significativos para a ampliação do conhecimento dos genes envolvidos no patossistema
Coffea - H. vastatrix. Desse modo, objetivou-se com esse estudo sequenciar e
caracterizar, por meio de análises de bioinformática, uma região do genoma do Híbrido
de Timor CIFC 832/2, que contém marcadores associados à resistência à H. vastatrix.
Para isso foi realizado o sequenciamento do clone BAC 70-22F contendo a marca
funcional de resistência, por meio da Plataforma Illumina MiSeq (paired – end reads).
Posteriormente foi feita a montagem dos contigs e a predição dos genes. Realizou-se a
anotação gênica com base nos genomas de Coffea arabica, Coffea canephora e Coffea
eugenioides, utilizando a ferramenta BLAST. A anotação gênica revelou a presença de
genes candidatos relacionados ao mecanismo de resistência de hospedeiros contra
patógenos. Foram anotados 991 genes do clone BAC 70-22F. Desses genes, 340 foram
anotados com similaridade com o genoma de C. arabica (var. Caturra), 337 com o
genoma de C. eugenioides e 314 com o genoma de C. canephora (clone IF 200). Com
base na anotação gênica foram selecionadas duas sequências de genes candidatos a
receptores like kinases (RLK) e desenhados primers para estudo do perfil de expressão
gênica durante a interação Coffea - H. vastatrix. Um possível gene de resistência, LRR
receptor-like serine/threonine-protein kinase GSO2, foi descrito e apresentou um perfil
vi
de expressão correspondente a uma resposta de resistência pré-haustorial. O outro
possível receptor like kinase em estudo, apresentando um domínio LRR, exibiu uma
diminuição na expressão gênica pré-haustorial em genótipos incompatíveis. As análises
filogenéticas desses genes, bem como os estudos de identidade e similaridade genética
da região genômica clonada, demonstraram uma relação mais próxima entre o clone
BAC 70-22F e a espécie C. arabica e corroboram com a diversidade genética descrita
para o HdT. Os resultados sugerem que a região genômica clonada do HdT CIFC 832/2
possui importantes genes candidatos a resistência do cafeeiro à H. vastatrix e
apresentam informações relevantes para ampliar o conhecimento sobre o HdT, podendo
contribuir para futuros planejamentos de estratégias de melhoramento do cafeeiro.
vii
ABSTRACT
ALVES, Danúbia Rodrigues, M.Sc., Universidade Federal de Viçosa, July, 2019.
Characterization of a genomic region of the Híbrido de Timor CIFC 832/2
associated with resistance to Hemileia vastatrix. Advisor: Eveline Teixeira Caixeta.
Co-advisers: Dênia Pires de Almeida and Tiago Antônio de Oliveira Mendes.
Coffee leaf rust, caused by the biotrophic fungus Hemileia vastatrix is the main disease
of economic importance of this crop, being responsible for major damages to world
coffee. New races of the pathogen have emerged infecting coffee cultivars marketed as
resistant to this disease. Thus, due to the high adaptive potential of the fungus, the
search for coffee resistant to this disease is a recurrent activity in breeding programs.
Studies with the Híbrido de Timor (HdT) have been conducted in research aimed at
durable resistance to rust and other coffee diseases. Understanding the nature of
enduring resistance in HdT genotypes and describing the genes involved in plant
defense is critical to the efficient use of the resources available in this natural hybrid.
The use of molecular and bioinformatics tools has shown significant results to increase
the knowledge of the genes involved in the Coffea - H. vastatrix pathosystem. Thus, the
aim of this study was to sequencing and characterize, through bioinformatics analysis, a
region of the Híbrido de Timor CIFC 832/2 genome, which contains markers associated
with resistance to H. vastatrix. For this, the sequencing of clone BAC 70-22F
containing the functional resistance mark was performed by means of the Illumina
MiSeq Platform (paired - end reads). Subsequently, the contigs were assembled and the
genes predicted. Genic annotation was performed based on the genomes of Coffea
arabica, Coffea canephora and Coffea eugenioides, using the BLAST tool. The gene
annotation revealed the presence of candidate genes related to the mechanism of host
resistance against pathogens. 991 genes of clone BAC 70-22F were noted. Of these
genes, 340 were noted similarly with the C. arabica genome (var. Caturra), 337 with the
C. eugenioides genome and 314 with the C. canephora genome (clone IF 200). Based
on the gene annotation, two sequences of candidate genes receptor like kinases (RLK)
were selected and primers designed to study the gene expression profile during the
Coffea - H. vastatrix interaction. A possible resistance gene, receptor-like serine /
threonine protein kinase GSR2 LRR, has been described and has an expression profile
corresponding to a pre-haustorial resistance response. The other possible receptor like
kinase under study, presenting an LRR domain, exhibited a decrease in pre-haustorial
viii
gene expression in incompatible genotypes. Phylogenetic analyzes of these genes, as
well as genetic identity and similarity studies of the cloned genomic region,
demonstrated a closer relationship between clone BAC 70-22F and C. arabica and
corroborated the genetic diversity described for HdT. The results suggest that the cloned
genomic region of HdT CIFC 832/2 has important candidate genes for resistance to H.
vastatrix coffee and presents relevant information to increase knowledge about HdT and
may contribute to future planning of coffee breeding strategies.
ix
SUMÁRIO
1. Introdução ..................................................................................................................... 1
2. Material e Métodos ....................................................................................................... 5
2.1. Rastreio e sequenciamento do clone BAC ................................................................ 5
2.2. Análises de bioinformática ........................................................................................ 6
2.2.1. Montagem de contigs ............................................................................................. 6
2.2.2. Predição gênica ....................................................................................................... 7
2.2.3. Anotação de genes .................................................................................................. 7
2.3. Análise de expressão gênica ...................................................................................... 7
2.4. Estudos filogenéticos ................................................................................................. 9
3. Resultados ................................................................................................................... 10
3.1. Rastreio e sequenciamento do clone BAC .............................................................. 10
3.2. Análises de bioinformática ...................................................................................... 11
3.3. Análise de expressão gênica .................................................................................... 12
3.4. Estudos filogenéticos ............................................................................................... 13
4. Discussão.....................................................................................................................20
5. Conclusões .................................................................................................................. 25
Referências Bibliográficas ....................................................................................... .267
Apêndices ...................................................................................................................33
1
1. Introdução
As perdas na produção cafeeira é um dos problemas de destaque enfrentado
pelos cafeicultores devido à suscetibilidade do café a diferentes doenças (CARVALHO
et al., 2012). A principal doença de importância econômica dessa cultura é a ferrugem,
causada pelo fungo biotrófico Hemileia vastatrix, que ocasiona grandes prejuízos à
cafeicultura mundial (AVELINO et al., 2015; ZAMBOLIM, 2016). A maioria das
variedades comerciais de Coffea arabica, espécie de grande valor econômico, é
suscetível a essa doença (ZAMBOLIM, 2016; TALHINHAS et al., 2017). A ferrugem
do cafeeiro foi constatada pela primeira vez no Brasil no ano de 1970, na região sul do
estado da Bahia. Quatro meses após a primeira observação da doença no país, a
ferrugem foi encontrada em diferentes regiões produtoras de café. Hoje, a H. vastatrix
está amplamente distribuída nas áreas cafeeiras em todo o mundo e novas raças do
patógeno, capazes de suplantar a resistência, têm surgido. (CABRAL et al., 2009;
TALHINHAS et al., 2017).
O sucesso da infecção do cafeeiro por esse patógeno depende da sua habilidade
em suprimir as respostas da planta (JONES e DANGL, 2006). No processo de
coevolução de plantas e patógenos, as plantas desenvolveram a capacidade de
reconhecer padrões moleculares e efetores do patógeno, ativando uma resposta de
defesa elaborada. De forma similar, os patógenos desenvolveram estratégias contra os
mecanismos de defesa das plantas, havendo uma complexa dinâmica de evolução na
interação planta-patógeno (JONES e DANGL, 2006; FRANTZESKAKIS et al., 2019).
As ferrugens formam uma estrutura especializada, haustórios, no mesófilo das
células dos seus hospedeiros durante o processo de infecção. Essa estrutura desempenha
um papel importante na infecção, sendo responsável pela absorção de nutrientes a partir
do hospedeiro. Além disso, induz mudanças estruturais na célula hospedeira, como o
rearranjo do citoesqueleto, a migração do núcleo e a condensação da cromatina
(MENDGEN e HAHN, 2002). Acredita-se que essas modificações são induzidas pela
atuação de proteínas efetoras produzidas nos haustórios, que são secretadas na matriz
extra-haustorial e translocadas para o interior da célula vegetal. A resposta de
resistência às ferrugens normalmente é observada após a formação dos haustórios
indicando que os genes Avr (Avr – avirulência) do patógeno são expressos nessa
estrutura (DODDS et al., 2009).
https://nph.onlinelibrary.wiley.com/action/doSearch?ContribAuthorStored=Frantzeskakis%2C+Lamprinos
2
O sistema de defesa da planta pode ser representado por um sistema imune inato,
constituído por duas linhas de defesa. Na primeira linha de defesa, há o reconhecimento
do patógeno por padrões moleculares associados à patógenos (PAMPs – Pathogen
Associated Molecular Patterns) ou por padrões moleculares associados à
microrganismos (MAMPs – Microbe Associated Molecular Patterns) resultando a
imunidade desencadeada por PAMPs/MAMPs (PTI - Pathogen Triggered Immunity)
(JONES e DANGL, 2006). Os PAMPs/MAMPs são identificados por receptores de
reconhecimento padrão (PRR - Pattern Recognition Receptor) localizados na superfície
da membrana celular ou no interior da célula. Eles levam à formação de uma cascata de
transdução de sinais ativando a resposta de defesa do hospedeiro. Geralmente os PRRs
são proteínas transmembranas pertencentes à classe das proteínas semelhantes a
receptores (RLPs) ou receptores do tipo quinases (RLKs) e apresentam repetições ricas
em leucina (LRRs) ou motivo de lisina (LysM) no domínio extracelular, região
responsável pelo reconhecimento de PAMPs (JONES e DANGL, 2006; BECK et al.,
2012).
Patógenos bem adaptados muitas vezes são capazes de suplantar a PTI por meio
do transporte de proteínas efetoras para o citoplasma do hospedeiro. Dessa forma, uma
segunda linha de defesa é ativada, a imunidade desencadeada por efetores (ETI -
Effector Triggered Immunity). Essa é uma linha de defesa mais específica e eficaz para
alguma(s) raça(s) do patógeno (JONES e DANGL, 2006). Na ETI, as plantas
apresentam proteínas de resistência (R) que reconhecem os efetores do patógeno (Avr)
resultando em resistência. O reconhecimento de efetores pelas proteínas R pode ser
direto (modelo gene-a-gene) ou indireto (modelo guarda). No modelo gene-a-gene, o
reconhecimento se dá de forma direta entre as proteínas R e Avr. Por sua vez, no
modelo guarda o reconhecimento pelas proteínas R é realizado por meio do
monitoramento de uma proteína acessória da planta hospedeira, alvo dos efetores do
patógeno (SEKHWAL et al., 2015; REDDY e NARESH, 2018).
A maioria dos genes R codificam proteínas que contêm um domínio C-terminal
rico em repetições de leucina (LRR) e um domínio conservado contendo sítios de
ligação a nucleotídeos (NBS), pertencendo à classe de genes de resistência NBS-LRR.
O domínio LRR pode interagir com a proteína Avr ou com um complexo de proteínas
formado pela Avr e outras proteínas do hospedeiro. O domínio NBS atua como
sinalizadores celulares e provavelmente iniciam a resposta de resistência em plantas
(RIBAS et al., 2011; REDDY e NARESH, 2018). Os genes R de diferentes espécies de
3
plantas compartilham domínios conservados e podem ser usados para triagem de
genomas de plantas para putativos genes de resistência (REDDY e NARESH,
2018). Análogos de genes de resistência (RGAs) conservam domínios e motivos
proteicos que desempenham papéis específicos na defesa da planta contra patógenos
(SEKHWAL et al., 2015).
A resistência das plantas de cafeeiro na interação com o fungo H. vastatrix é
condicionada por no mínimo nove genes dominantes de efeito maior (NORONHA e
BETTENCOURT, 1967; BETTENCOURT et al., 1988) e se baseia no modelo gene-a-
gene, proposto por Flor (1971). De acordo com esse modelo, ocorre o reconhecimento
dos genes Avr das diferentes raças de H. vastatrix, por parte dos fatores de resistência
do cafeeiro. Seguindo o modelo gene-a-gene, foi inferida a existência de nove genes de
virulência (v1-v9) em H. vastatrix (NORONHA e BETTENCOURT, 1967;
BETTENCOURT et al., 1988). Atualmente, o número de perfis de virulência da
ferrugem do cafeeiro provavelmente vai muito além das raças caracterizadas
(TALHINHAS et al., 2017). A raça XXXIII de H. vastatrix, por exemplo, contém genes
(v5,7 ou v5,7,9) capazes de suplantar a resistência de algumas cultivares que foram
inicialmente caracterizadas como resistentes ao fungo causador da ferrugem
(CAPUCHO et al., 2012). Dessa forma, a obtenção de cultivares com resistência
durável tem sido um desafio para os melhoristas.
Estudos com o Híbrido de Timor (HdT), um híbrido interespecífico natural entre
Coffea arabica e Coffea canephora (BETTENCOURT, 1973), tem sido de grande
importância para os progressos alcançados em pesquisas visando a resistência do
cafeeiro à H. vastatrix. O HdT e as progênies derivadas do seu cruzamento com outros
cultivares vêm sendo estudados em diversas regiões produtoras de café no mundo
(TALHINHAS et al., 2017; SOUSA et al., 2017; SILVA et al., 2018). Esse
germoplasma tem sido utilizado em programas de melhoramento que visam resistência
durável à ferrugem e outras doenças do cafeeiro (SILVA et al., 2018). Entretanto, o
HdT ainda contém genes que não foram caracterizados (CAPUCHO et al., 2009;
DIOLA et al., 2011; PESTANA et al., 2015). Entre os derivados do HdT, CIFC (Centro
de Investigação das Ferrugens do Cafeeiro, Portugal) 832/1 e CIFC 832/2 são de suma
importância, pois unem a resistência à patógenos e boas características agronômicas. A
resistência do HdT CIFC 832/2 pode ser mais durável do que em outros genótipos de
HdT e contém ainda respostas mais rápidas de resistência à ferrugem
(BETTENCOURT, 1973; DINIZ et al., 2012).
4
Compreender melhor a diversidade genética e a natureza da resistência
duradoura em genótipos do HdT é fundamental para o uso eficiente dos recursos
disponíveis nesse híbrido natural (SETOTAW et al., 2010; TALHINHAS et al., 2017).
O estudo do perfil de expressão gênica durante a interação Coffea - H. vastatrix pode
facilitar a identificação dos genes envolvidos na resistência e auxiliar na compreensão
dos mecanismos de defesa da planta (BARKA et al., 2017; FLOREZ et al., 2017).
Estudos com o objetivo de entender a diversidade genética do HdT também contribuem
para o planejamento de estratégias de melhoramento (SETOTAW et al., 2010).
A expansão das pesquisas genômicas, possibilitada pelo desenvolvimento de novas
tecnologias, tem aumentado em larga escala a quantidade de informações biológicas
disponíveis (ETIENNE et al., 2002; MICHNO e STUPAR, 2018). Os avanços da
biotecnologia em conjunto com os estudos de bioinformática, aplicados ao
melhoramento, têm auxiliado na compreensão e manipulação gênica (EDWARDS e
BATLEY, 2004; MICHNO e STUPAR, 2018). Essas ferramentas possibilitam a
ampliação do conhecimento dos genes que estão envolvidos na resistência de Coffea à
H. vastatrix, podendo levar a identificação e até mesmo a clonagem de genes essenciais
para a resistência do cafeeiro (ETIENNE et al., 2002; FERNANDES-BRUM et al.,
2017).
Utilizando essas ferramentas, o estudo do transcriptoma da interação Coffea - H.
vastatrix, permitiu identificar genes candidatos, relacionados ao mecanismo de defesa
do cafeeiro e caracterizar a expressão desses genes em interação compatível e
incompatível (Florez et al., 2017). Sendo relatados genes RLKs envolvidos na primeira
resposta de defesa da planta. Essa resposta precoce é fundamental para introduzir
cascatas de sinalização na PTI e posterior a expressão de genes envolvidos em
mecanismos de defesa (KUMAR e KIRTI, 2011). Acredita-se que a resistência pré-
haustorial, antes das 24 horas após a inoculação na interação cafeeiro – H. vastatrix,
seja mais durável por envolver vários mecanismos de defesa do hospedeiro,
consolidando a proteção da planta (HEATH, 2000; LOPES, 2015). O perfil de
expressão do gene putative probable receptor-like protein kinase At5g39020,
previamente identificado por Florez et al. (2017), mostrou uma resposta pré-haustorial
no genótipo resistente e uma expressão mais tardia no genótipo suscetível. Os autores
concluíram que esse gene provavelmente está relacionado ao reconhecimento do
patógeno na primeira linha de defesa da planta. Assim, esse marcador apresenta
5
características significativas para o estudo da resistência de plantas no patossistema
Coffea - H. vastatrix.
Desse modo, objetivou-se sequenciar e caracterizar uma região do genoma da
principal fonte de resistência do cafeeiro à Hemileia vastatrix, o Híbrido de Timor CIFC
832/2, utilizando o marcador putative probable receptor-like protein kinase At5g39020.
A identificação de genes nessa região será empregada para ampliar o conhecimento da
resistência do cafeeiro a essa importante doença.
2. Material e Métodos
2.1. Rastreio e sequenciamento do clone BAC
Foi feito o rastreio de uma biblioteca de clones BAC (Bacterial Artificial
Chromosome), mantida no Laboratório de Biotecnologia do Cafeeiro (Universidade
Federal de Viçosa – MG), com o marcador putative probable receptor-like protein
kinase At5g3920. Esta biblioteca foi construída a partir do cafeeiro HdT CIFC 832/2
(CAÇÃO et al., 2013), genótipo portador de fatores genéticos que condicionam
resistência a diferentes patógenos e boas características agronômicas
(BETTENCOURT, 1973). A biblioteca contém 56.832 clones BAC em 148 placas de
titulação de 384 poços. (CAÇÃO et al., 2013).
Os clones foram replicados em placas de titulação de 384 poços contendo 70μl
de meio LB fresco (com 12,5μgml-1 Cloranfenicol), usando um replicador de placas
esterilizado, sob capela de fluxo de ar laminar. A multiplicação da cultura foi feita por
meio da incubação das placas em agitador com temperatura de 37°C durante 18h e
velocidade de 180rpm. Após a incubação, com a finalidade de identificar os clones com
a marca, foi utilizada a metodologia de decomposição do agrupamento das BAC. A
placa foi dividida em duas parte e coletado o pool de cada parte. Posteriormente a meia
placa da biblioteca contendo o marcador foi decomposta em quatro grupos de 48 clones,
seguida da análise das colunas verticais até chegar a um único clone BAC (DIOLA,
2009). O DNA plasmidial do clone foi extraído com o kit Wizard® Plus SV Minipreps
DNA purification System (Promega), seguindo as recomendações do fabricante. A
quantificação foi realizada com o auxílio do Qubit dsDNA BR (Life Technologies) e
espectrofotômetro NanoDropTM (Thermo Fisher Scientific). A PCR foi otimizada
contendo 50ng DNA plasmidial, 0,1μM de cada primer, 0,15mM de dNTP (Promega),
6
1,0mM MgCl2, 1,0U de Taq DNA polymerase (Invitrogen), e 1X PCR reação buffer,
com volume final de 20μL. O DNA foi amplificado em termociclador (PTC - 200 - MJ
Research and Veriti - Applied Biosystems), programado com desnaturação inicial a
94°C por 10min, seguida por 35 ciclos desnaturação a 94°C por 30s, anelamento a 61°C
por 30s e extensão a 72°C por 1min. Finalizando com uma extensão final de 72°C por
10min. O produto foi visualizado em gel de agarose (1,5%).
O clone identificado foi sequenciado por meio da plataforma Illumina MiSeq
(paired-end reads). Para isso, 50ng de DNA plasmidial foi submetido a uma reação de
fragmentação aleatória na qual o DNA foi fragmentado e ligado a adaptadores
específicos utilizando o kit Nextera® XT DNA Sample Preparation (Illumina),
conforme instrução do fabricante. Em seguida, o DNA purificado foi amplificado
utilizando iniciadores complementares aos adaptadores. Os produtos foram
quantificados por meio do espectrofotômetro Qubit DNA BR (Life Technologies). As
bibliotecas foram diluídas em uma solução de Tris-HCl e Tween 0,1%, depositadas em
uma flowchip e submetidas a 500 ciclos (2x250bp) de sequenciamento utilizando MiSeq
Reagent Kit v2 (Illumina).
2.2. Análises de bioinformática
2.2.1. Montagem de contigs
Após o sequenciamento, as reads geradas foram submetidas a análises de
bioinformática para a edição, montagem e anotação dos contigs, com o intuito de
interpretar o contexto biológico. Realizou-se uma avaliação de qualidade das reads
sequenciadas utilizando o software FastQC (versão 0.11.5) (ANDREWS, 2010). Em
seguida, foram removidas as sequências contaminantes e as de baixa qualidade por meio
do software Trimmomatic (versão 0.36) (LOHSE et al., 2012). Com base nas sequências
selecionadas, realizou-se a montagem dos contigs e scaffolds usando o software SPAdes
(BANKEVICH et al., 2012), empregando a estratégia de montagem de novo. Efetuou-se
uma avaliação de qualidade da montagem dos scaffolds utilizando a ferramenta de
avaliação de montagem de genoma QUAST (versão 5.0.2) (MIKHEENKO et al.,
2018).
7
2.2.2. Predição gênica
Utilizando o software AUGUSTUS (http://augustus.gobics.de/), os genes foram
preditos a partir dos contigs para a obtenção do número de exons, íntrons e transcritos
(STANKE et al., 2004). A predição gênica foi realizada com base no reconhecimento de
regiões previamente caracterizadas de Solanum lycopersicum. Essa espécie foi usada
como referência por ser geneticamente próxima ao gênero Coffea e assim,
compartilharem repertórios de genes comuns (LIN et al., 2005).
2.2.3. Anotação de genes
A anotação dos genes foi efetuada utilizando a ferramenta para busca de
similaridade de sequência, BLASTp (Basic Local Alignment Search Tool) com e-value
de 10-5. Foi utilizada uma estratégia baseada em similaridade para identificar sequências
relacionadas com funções já conhecidas em genoma de C. arabica (var. Caturra), C.
eugenioides (NCBI - https://www.ncbi.nlm.nih.gov/) e C. canephora (clone IF 200)
(COFFEE GENOME HUB - http://coffee-genome.org/). As sequências foram anotados
a partir do melhor alinhamento (best hit) com cada genoma.
2.3. Análise de expressão gênica
Com base na anotação gênica foram selecionadas duas sequências de genes
candidatos a receptores like kinase (RLK). Para as duas sequências escolhidas foram
desenhados primers utilizando o servidor GenScript (https://www.genscript.com/) e o
programa Oligo Explorer (versão 1.5) (KUULASMAA, 2010). Foi desenhado um
conjunto de primers para cada sequência de genes candidatos a RLK. Foram desenhados
primers para o gene anotado como LRR receptor-like serine/threonine-protein kinase
GSO2 (Gene1: F: 5’-TGGCGGATCAAGTGCATCT-3’; 60,3°C - R: 5’-
TCGTCTCCTTGAAACTCTTGC-3’; 58,3°C; 154pb). Também foram desenhados
primers para o gene anotado como putative receptor-like protein kinase At3g47110
(Gene2: F: 5’-GCCTTGGATTTGGCGATAA-3’; 56,8°C - R: 5’-
CTGAGGAAGCATGAGACC-3’, 57,1°C; 143pb). Os primers desenhados foram
utilizados nas reações de PCR quantitativo em tempo real (RT-qPCR).
O experimento para a análise de expressão gênica foi conduzido em um
delineamento experimental inteiramente casualizado, com três repetições biológicas.
8
Utilizaram-se plantas jovens C. arabica var. Caturra CIFC 19/1 (interação compatível) e
Híbrido de Timor CIFC 832/1 (interação incompatível), as quais foram inoculadas com
a raça XXXIII de H. vastatrix. A inoculação foi realizada como proposto por Capucho
et al. (2009). Esses cafeeiros usados na análise de expressão gênica correspondem aos
parentais da cultivar Oeiras MG 6851, que teve sua resistência suplantada pela raça
XXXIII do patógeno. As amostras foram coletadas em 0, 12, 24 e 72 hai. Para a
extração do RNA, as folhas inoculadas foram coletadas e maceradas em N2 líquido. O
RNA total foi extraído com 100mg de tecido macerado e Rneasy Plant Mini Kit
(Qiagen), seguindo as recomendações do fabricante. A quantificação foi realizada com
o uso do espectrofotômetro Qubit RNA BR (Life Technologies) e NanoDropTM
(Thermo Fisher Scientific). A integridade do RNA foi avaliada por eletroforese em gel
de agarose (1,5%) corado com brometo de etídio. As amostras foram armazenadas em
ultracongelamento a -80°C, até o uso. O cDNA foi sintetizado com 3μg de RNA total,
pré-tratado com 1μl de DNAse por 15min (50U/μL, DNAseI de Inversão,
InvitrogenTM) para remover possíveis contaminantes do DNA genômico. A primeira
cadeia de cDNA foi sintetizada utilizando o kit de RT-PCR do Protocolo de Transcrição
Reversa ImProm-II ™ (Promega), de acordo com as orientações do fabricante e
armazenada a -20°C até a utilização.
Para a realização da técnica de PCR quantitativo em tempo real, em aparelho 7500
Real Time PCR Systems (Applied Biosystems), foi utilizado o sistema de detecção de
fluorescência SYBR Green I (Applied Biosystems, California, USA). Para cada reação
utilizou-se 2μl da diluição da reação de síntese de cDNA de fita simples, 1μl de primers
forward e reverse, 5μl de SYBR® Green PCR Master Mix (Applied Biosystems), 0,2μl
de Dyer e 1μl de água estéril. Para um volume final de 10μl com 50ng/μl de cDNA e
100nM de primers. As condições da reação foram: 95°C por 10min para a desnaturação
inicial, seguido por 40 ciclos de 95°C por 15s e 60°C por 1min. O nível de expressão
dos genes foi calculado utilizando os valores médios de Ct, resultante de três réplicas
biológicas e três réplicas técnicas.
Para a normalização dos dados foram utilizados dois genes constitutivos
selecionados (Ubiquitina10 e Gliceraldeído-3-fosfato desidrogenase) cujas expressões
foram encontradas estáveis (CRUZ et al., 2009). As análises estatísticas foram
realizadas utilizando o software Prism 5 (versão 5.01) (MOTULSKY, 2007). Todos os
dados são apresentados como média. A diferença no nível de expressão entre interações
em uma mesma hora de mensuração foi calculada utilizando o teste o Teste de Tukey (p
9
< 0,05). A diferença no nível de expressão entre amostras não inoculadas e amostras
inoculadas foi calculada utilizando ANOVA seguida pelo Teste de Tukey (p < 0,05).
2.4. Estudos filogenéticos
Foram efetuados estudos da relação genética do clone BAC selecionado (70-22F),
utilizando software TopHat (versão 2.1.1) (TRAPNELL et al., 2009), em comparação
com quatro genomas de Coffea: C. arabica1 var. Caturra (NCBI -
https://www.ncbi.nlm.nih.gov/); C. arabica2, var. Típica (dados não publicados); C.
arabica3, var. Bourbon (WCR - https://worldcoffeeresearch.org/) e Coffea canephora
clone IF 200 (COFFEE GENOME HUB - http://coffee-genome.org/). No software
realizou-se uma busca de identidade genética entre as reads geradas pelo
sequenciamento do clone BAC 70-22F e as variedades de Coffea em estudo. Também
foi realizada uma busca de similaridade de sequências (BLASTp com e-value de 10-5)
entre o clone e os quatro genomas. A porcentagem de BLAST foi calculada a partir dos
dois melhores alinhamentos, de cada genoma com cada sequência de contigs.
Além disso, também realizaram-se análises filogenéticas baseadas em alinhamentos
de cinco sequências gênicas conservadas e de cópia única do clone BAC 70-22F e dos
quatro genomas de Coffea. As análises foram realizadas utilizando o software MEGA-
X-10.0.5 (KUMAR et al., 2018). As cinco sequências gênicas conservadas, 3-oxoacyl-
[acyl-carrier-protein] reductase 4, UDP-glucose 6-dehydrogenase 5-like, succinate-
semialdehyde dehydrogenase%2C mitochondrial-like, asparagine synthetase
[glutamine-hydrolyzing] e Enolase, foram escolhidas com base na anotação gênica. A
história evolutiva das sequências proteicas foi inferida utilizando o método Maximum
Likelihood, baseado no modelo de Tamura-Nei com bootstrap de 1.000 réplicas
(FELSENSTEIN, 1985; TAMURA e NEI, 1993).
Análises filogenéticas foram realizadas para os dois possíveis genes de resistência
selecionados, LRR receptor-like serine/threonine-protein kinase GSO2 (Gene1) e
putative receptor-like protein kinase At3g47110 (Gene2), utilizando o software MEGA-
X-10.0.5 (KUMAR et al., 2018). O estudo filogenético foi efetuado com base nos
melhores alinhamentos (BLASTp com e-value de 10-5) de sequências proteicas, dos dois
genes com os quatro genomas de Coffea: C. arabica1 var. Caturra; C. arabica2, var.
Típica; C. arabica3, var. Bourbon e Coffea canephora clone IF 200. A história
evolutiva das sequências proteicas foi inferida utilizando o método Maximum
10
Likelihood, baseado no modelo de Tamura-Nei com bootstrap de 1.000 réplicas
(FELSENSTEIN, 1985; TAMURA e NEI, 1993). Posteriormente, foram caracterizados
os domínios das sequências proteicas do Gene1, do Gene2 e das sequências de Coffea
que ficaram mais próximas na árvore filogenética desses dois genes de interesse. Essa
análise foi executada no banco de dados de famílias proteicas Pfam
(https://pfam.xfam.org/search/sequence) (FINN et al., 2013).
3. Resultados
3.1. Rastreio e sequenciamento do clone BAC
Para caracterização de uma região genômica com potencial associação à
resistência do cafeeiro, o marcador molecular capaz de amplificar o gene putative
probable receptor-like protein kinase At5g39020 foi utilizado para analisar uma
biblioteca de clones BAC do cafeeiro HdT CIFC 832/2 (CAÇÃO et al., 2013). Após o
rastreio com o marcador, identificou-se o clone BAC 70-22F contendo a marca
funcional desse gene (Figura 1). O fragmento de DNA do clone BAC 70-22F foi
extraído e posteriormente sequenciado. Foram obtidas 122.273 reads de alta qualidade
com o sequenciamento do clone BAC 70-22F.
Figura 1. Produto de amplificação da biblioteca BAC (HdT CIFC 832/2 ). a) Marcador
de peso molecular 100pb. b) Clone BAC 70-22F contendo a marca funcional do
a) b) c)
11
putative probable receptor-like protein kinase At5g39020. c) Clone BAC 70-23F não
apresentando a marca funcional do putative probable receptor-like protein kinase
At5g39020.
3.2. Análises de bioinformática
Utilizando estratégias de bioinformática, foi realizada a montagem da sequência
de DNA a partir das reads de qualidade obtidas com o sequenciamento do clone BAC
70-22F. A montagem resultou em 3.355 scaffolds. A região genômica montada
apresentou um valor de N50 de 1.080 pb e L50 de 605 pb, a percentagem de CG foi de
43,43 (Tabela 1).
Tabela 1. Parâmetros estatísticos da montagem do clone BAC 70-22F.
Características do genoma Valores
Reads de alta qualidade 122.273
Número total de bases 230.817 pb
Número de scaffolds 3.355
Maior scaffold 6.472 pb
N50 1.080 pb
L50 605 pb
Número total de bases (* ≥ 0 pb)
Número total de bases (* ≥ 1.000 pb)
1.080.585 pb
1.17.713 pb
Número total de bases (* ≥ 5.000 pb) 24.466 pb
Número total de bases (* ≥ 10.000 pb) 0
Número total de bases (* ≥ 25.000 pb) 0
Número total de bases (* ≥ 50.000 pb) 0
GC (%) 43,43
*: scaffolds; pb: pares de bases.
Empregando a ferramenta para busca de similaridade de sequências (BLAST),
foram anotados 991 genes a partir os genes preditos do clone BAC 70-22F. Desses
genes, 340 foram anotados com similaridade com o base no genoma de C. arabica (var.
Caturra), 337 com o genoma de C. eugenioides e 314 com o genoma de C. canephora
(clone IF 200) (Apêndice A). Em relação aos genes anotados a partir do genoma de C.
12
arabica, 173 foram encontrados no subgenoma C. eugenioides (CE), 152 no subgenoma
C. canephora (CC) e 15 com sequências não caracterizadas em cromossomos.
A anotação gênica revelou a presença de genes candidatos relacionados ao
mecanismo de resistência de hospedeiros contra patógenos. Foram identificados genes
como um análogo ao putative late blight resistance protein homolog R1A-4, cysteine
synthase, entre outros possíveis genes envolvidos no mecanismo de defesa de plantas
(Apêndice A).
3.3. Análise de expressão gênica
Foram selecionados dois genes análogos de resistência (RGAs), identificados na
região genômica do HdT CIFC 832/2 (BAC 70-22F), para a análise de expressão. Os
genes escolhidos, LRR receptor-likeserine/threonine-protein kinase GSO2 (Gene1) e
putative receptor-like protein kinase At3g47110 (Gene2), são candidatos a receptores
like kinase (RLK).
As análises de expressão gênica mostraram resultados significativos para os dois
genes selecionados do clone BAC 70-22F. Na análise da expressão do Gene1 foram
observadas diferenças significativas entre interação incompatível e compatível às 12 e
24 hai (Figura 2). Na interação compatível não houve diferença de expressão quando
comparados os diferentes tempos após infecção. Na interação incompatível, observou-se
um aumento de expressão do gene às 12 hai, momento em que também houve diferença
significativa entre as interações incompatível e compatível (Figura 2).
Figura 2. Análise de expressão por PCR em tempo real do Gene1. O padrão de
expressão foi mensurado em 0 hora, amostras não inoculadas, 12, 24 e 72 horas após a
**
*
LRR receptor-like serine/threonine-protein kinase GSO2
Interação incompatível
Interação compatível
0 hai 12 hai 24 hai 72 hai
13
inoculação de urediniósporos frescos (H. vastatrix – raça XXXIII) em plantas
incompatíveis (HdT CIFC 832/1) e compatíveis (C. arabica var. Caturra CIFC 19/1).
(*) Diferença significativa no nível de expressão entre interações na mesma hai. (*)
Diferença significativa em relação às amostras não inoculadas (0h) na mesma interação.
A expressão do gene Gene2 analisado entre interações incompatível e
compatível e mensurados em horários iguais de infecção, revelou diferença significativa
às 0 e 72 hai. Em ambos os horários, a interação incompatível apresentou maior
expressão do gene (Figura 3). Na interação incompatível houve uma diminuição da
expressão relativa do Gene2 em relação ao mesmo genótipo avaliado às 0h. A interação
compatível revelou um aumentou significativo de expressão do Gene2 às 24 hai (Figura
3).
Figura 3. Análise de expressão por PCR em tempo real do Gene2. O padrão de
expressão foi mensurado em 0 hora, amostras não inoculadas, 12, 24 e 72 horas após a
inoculação de urediniósporos frescos (H. vastatrix – raça XXXIII) em plantas
incompatíveis (HdT CIFC 832/1) e compatíveis (C. arabica var. Caturra CIFC 19/1).
(*) Diferença significativa no nível de expressão entre interações na mesma hai. (*)
Diferença significativa em relação às amostras não inoculadas (0h) na mesma interação.
3.4. Estudos filogenéticos
Análises filogenéticas foram realizadas para ampliar o conhecimento do clone BAC
70-22F. As reads obtidas no sequenciamento da BAC e os quatro genomas de Coffea
foram submetidas a uma busca por identidade genética. Observou- se que as sequências
*
* * * **
putative receptor-like protein kinase At3g47110
Interação incompatível
Interação compatível
0 hai 12 hai 24 hai 72 hai
14
do clone BAC 70-22F possuem maior grau de identidade genética com o genoma de C.
arabica var. Caturra (14,6%), seguida de C. arabica var. Típica (11,8%). A identidade
genética com o genoma C. arabica var. Bourbon foi de 4,0 %. A menor identidade
genética mensurada foi obtida em comparação com o genoma de C. canephora (0,2%)
(Figura 4).
Figura 4. Identidade genética entre as reads geradas pelo sequenciamento do clone
BAC 70-22F e as variedades Caturra (C. arabica1), Típica (C. arabica2), Bourbon (C.
arabica3) e clone IF 200 (C. canephora).
Uma busca por similaridade de sequências também foi realizada entre os
scaffolds montados da BAC 70-22F e os quatro genomas de Coffea. Resultado
semelhante ao encontrado com as reads foi observado. Nessa análise, maior
similaridade foi observada para C. arabica var. Caturra (62,56%), seguida de C. arabica
var. Típica (37,15%), C. arabica var. Bourbon (0,27%) e C. canephora (0,02%) (Figura
5).
15
Figura 5. Similaridade de sequências entre o clone BAC 70-22, montado em contigs, e
as variedades Caturra (C. arabica1), Típica (C. arabica2), Bourbon (C. arabica3) e
clone IF 200 C. canephora. A porcentagem de BLAST foi calculada a partir dos dois
melhores alinhamentos de cada genoma com cada sequência de contigs.
Na caracterização do clone BAC 70-22F foram ainda analisados alguns genes
conservados, cópia única, encontrados na anotação gênica. Com base na análise
filogenética das sequências gênicas conservadas e dos quatro genomas de Coffea, o
clone alinhou em diferentes grupos de acordo com o gene analisado (Figura 6).
16
Figura 6. Árvores filogenéticas baseadas em alinhamento dos genomas C. arabica1
var. Caturra, C. arabica2 var. Típica, C. arabica3 var. Bourbon, C. canephora clone IF
200 e de sequências gênicas conservadas do clone BAC 70-22. a) 3-oxoacyl-[acyl-
carrier-protein] reductase 4 (Gene1). b) UDP-glucose 6-dehydrogenase 5-like (Gene2).
c) succinate-semialdehyde dehydrogenase%2C mitochondrial-like (Gene3). d)
asparagine synthetase [glutamine-hydrolyzing] (Gene4). e) Enolase (Gene5).
a
)
c
)
d
)
b
)
e
)
17
Estudos filogenéticos foram efetuados para aumentar o conhecimento da
possível origem dos dois genes selecionados do clone BAC 70-22F. O estudo foi
baseado em alinhamentos de sequências proteicas (Apêndice B) entre os dois genes
(Gene1 e Gene2) e os quatro genomas de referência do gênero Coffea (C. arabica1 var.
Caturra; C. arabica2, var. Típica; C. arabica3, var. Bourbon; Coffea canephora clone
IF 200) (Figuras 7 e 8).
Figura 7. Árvore filogenética baseada em alinhamento de sequências proteicas. Gene1:
LRR receptor-like serine/threonine-protein kinase GSO2. C. arabica1: sequências
proteicas da variedade Caturra (NCBI). C. arabica2: sequências proteicas da variedade
Típica (dados não publicados). C. arabica3: sequências proteicas da variedade Bourbon
(WCR). C. canephora: sequências proteicas do clone IF 200 (Coffee Genome Hub).
18
Figura 8. Árvore filogenética baseada em alinhamento de sequências proteicas. Gene2:
putative receptor-like protein kinase At3g47110. C. arabica1: sequências proteicas da
variedade Caturra (NCBI). C. arabica2: sequências proteicas da variedade Típica
(dados não publicados). C. arabica3: sequências proteicas da variedade Bourbon
(WCR). C. canephora: sequências proteicas do clone IF 200 (Coffee Genome Hub).
O Gene1 ficou no mesmo clado de quatro genes do genoma de C. arabica3 var.
Bourbon. De acordo com a anotação gênica, esses quatro genes são putativos: LRR
receptor-like serine/threonine-protein kinase GSO2 (C. arabica3 g6), uncharacterized
protein LOC113703097 (C. arabica3 g7), LRR receptor-like serine/threonine-protein
kinase GSO2 (C. arabica3 g8) e uncharacterized protein LOC113703097 (C. arabica3
g9) (Tabela 2). Dentro do clado, o Gene1 ficou mais próximo de um gene não
caracterizado de C. arabica3 (g9) (Figura 7). Posteriormente, foi realizada a busca pelos
19
domínios proteicos das sequências desse clado utilizando o servidor Pfam. As
sequências do clado, correspondentes aos cinco genomas, não apresentaram domínios
proteicos caracterizados (Tabela 2).
Tabela 2. Características de sequências proteicas de Coffea. Sequência proteica do
Gene1 e quatro sequências proteicas agrupadas em um mesmo clado na análise
filogenética.
Genoma Sequência proteica Anotação Domínios
BAC 70-22F
Gene1 LRR receptor-like
serine/threonine-protein
kinase GSO2
-
C. arabica3
g9-g19672.t1
uncharacterized protein
LOC113703097
-
C. arabica3
g8-g32952.t1
LRR receptor-like
serine/threonine-protein
kinase GSO2
-
C. arabica3
g6-g6102.t1
LRR receptor-like
serine/threonine-protein
kinase GSO2
-
C. arabica3
g7-g22356.t1
uncharacterized protein
LOC113703097
-
C. arabica3
g10-g5288.t1
uncharacterized protein
LOC113703097
-
O Gene2 ficou agrupado em um clado com dois genes do genoma de C.
arabica2 (var. Típica) e um do genoma C. arabica1 (var. Caturra). Os genes desse
clado estão anotados como: receptor-like serine threonine- kinase EFR (C. arabica2
g1), putative receptor-like protein kinase At3g47110 isoform X1 (C. arabica1 g1),
receptor-like serine threonine- kinase At3g47570 (C. arabica2 g2) (Tabela 3). A partir
de análises utilizando o servidor Pfam foi encontrado um domínio LRR1 na sequência
proteica do Gene2. As outras três sequências do clado também apresentaram domínio
LRR, mas LRR8 (Tabela 3). O gene receptor-like serine threonine- kinase EFR (C.
arabica2 g1), o qual mostrou-se mais próximo do Gene2 no clado (Figura 8), além do
domínio LRR8, também possui domínio Pkinase e LRRNT2 .
https://blast.ncbi.nlm.nih.gov/Blast.cgi#alnHdr_XP_027080133
https://blast.ncbi.nlm.nih.gov/Blast.cgi#alnHdr_XP_027080133
20
Tabela 3. Características de sequências proteicas de Coffea. Sequência proteica do
Gene2 e quatro sequências proteicas agrupadas em um mesmo clado na análise
filogenética.
Genoma Sequência proteica Anotação Domínios
BAC 70-22F Gene2 putative receptor-like protein
kinase At3g47110
LRR1
C. arabica2
(Scaffold4162HRSCAF
4163) gene-0.17 mRNA-1
receptor-like serine threonine-
kinase EFR
LRR8
LRRNT2
Pkinase
C. arabica1
XP027093211.1
putative receptor-like protein
kinase At3g47110 isoform X1
LRR8
LRRNT2
Pkinase
C. arabica2
(Scaffold4162HRSCAF
4163) gene-0.13 mRNA-1
receptor-like serine threonine-
kinase At3g47570
LRR8
LRRNT2
Pkinase
C. arabica1
g2-XP027093214.1
probable LRR receptor-like
serine/threonine-protein kinase
At3g47570
LRRNT2
LRR8
LRR8
Pkinase
4. Discussão
Por mio meio dos gráficos de análise de qualidade das sequências do clone BAC
70-22F, gerados pelo FastQC, observou-se que as reads obtidas pelo sequenciamento do
clone BAC 70-22F apresentaram boa qualidade. O valor obtido de N50 mostra que 50%
de toda a montagem está contida em scaffolds ≥ 1.080 pb. O N50 e o L50 da montagem
são respectivamente a média dos maiores scaffolds até a metade do genoma (50%) e o
número mínimo de scaffolds necessários para alcançar o valor N50 (GUREVICH e
VYAHNI, 2013). Valores alto de N50 aumentam as chances de encontrar genes
completos (LOPES, 2015; FLOREZ et al., 2017).
A biblioteca BAC foi obtida a partir do cafeeiro CIFC 832/2 que corresponde a
um híbrido interespecífico natural entre as espécies C. arabica e C. canephora
(CAÇÃO et al., 2013). A provável origem desse híbrido tetraploide fértil é a partir da
fecundação de um gameta não reduzido de C. canephora com um gameta de C. arabica
e posteriores eventos de retrocruzamentos com C. arabica (BETTENCOURT, 1973;
LASHERMES et al., 2000). Essa origem proposta para o HdT, corrobora para a maior
similaridade de sequências encontradas entre o clone BAC e o genoma de C. arabica.
21
Entretanto, os genótipos derivados do Híbrido de Timor apresentam alta diversidade
genética (SETOTAW et al., 2010).
Foram anotados 173 genes em similaridade com o genoma de C. arabica. Em
relação a esses genes, 173 foram encontrados no subgenoma C. eugenioides (CE), 152
no subgenoma C. canephora (CC) e 15 com sequências não caracterizadas em
cromossomos. A espécie C. arabica possui dois subgenomas, pois é alotetraplóide
(2n=44 cromossomos) (CLARINDO e CARVALHO, 2008) e tem origem da hibridação
natural entre duas espécies diploides, C. eugenioides (2n=22 cromossomos) e C.
canephora (2n=22 cromossomos) (LASHERMES et al., 1999). Estudos sobre a origem
de C. arabica sustentam a hipótese de que esse genoma resulta da associação dos
subgenomas CC e CE, no entanto, afirmam que há limites taxonômicos entre C. arabica
e C. canephora. Análises filogenéticas apresentam as três espécies em clusters distintos,
sustentados por um alto valor de bootstrap (LASHERMES et al., 1999).
Foram identificados no clone BAC 70-22F genes envolvidos na modulação da
defesa em diferentes etapas da infecção e genes como um análogo ao putative late blight
resistance protein homolog R1A-4, que desencadeia um sistema de defesa, incluindo
uma resposta hipersensível que restringe o crescimento do patógeno (HR). Também
foram identificados possíveis inibidores de proteases, envolvidos na morte programada
ou apoptose controlada por sinalização (cysteine synthase) (TALHINHAS et al., 2017),
entre outros possíveis genes envolvidos no mecanismo de defesa de plantas (Apêndice
A).
Genes candidatos relacionados a mecanismos de defesa semelhantes aos
apresentados nesse trabalho, foram identificados por Florez et al. (2017). O
transcriptoma da interação cafeeiro-H. vastatrix, foi analisado, considerando a interação
compatível (C. arabica var. Caturra CIFC 19/1 inoculado com a raça XXXIII) e
incompatível (HdT CIFC 832/1 inoculado com a raça XXXIII). Regiões gênicas com
funções similares também foram descritas por Barka et al. (2017). Os autores
analisaram uma biblioteca subtrativa e realizaram estudos de expressão gênica durante a
interação incompatível (HdT CIFC 832/2) e compatível (C. arabica cv. Catuaí IAC 44)
inoculados com a raça II de H. vastatrix. Esses trabalhos sustentam a hipótese de que a
região do genoma do HdT CIFC 832/2 clonada e sequenciada no presente trabalho
contém genes associados à resistência à H. vastatrix.
A partir da anotação dos genes presentes na região genômica do HdT CIFC
832/2 (BAC 70-22F), foram selecionados dois genes candidatos a receptores like kinase
22
(RLKs), para a análise de expressão gênica. Os RLKs são receptores de reconhecimento
padrão (PRRs) que permitem a identificação de uma ampla gama de patógenos levando
à PTI, constituindo a primeira linha de defesa da planta (SEKHWAL et al., 2015).
O padrão de expressão do Gene1 sugere uma resistência pré-haustorial na
interação incompatível, há reconhecimento do patógeno nas primeiras horas de
infecção. O fungo H. vastatrix estabelece uma relação biotrófica com o seu hospedeiro
em poucas horas após a inoculação, a produção de haustório ocorre logo que o fungo
entra nos estômatos e, provavelmente, antes de chegar à cavidade subestomática, ou
seja, aproximadamente às 24 hai (RAMIRO et al., 2009).
Resistência pré-haustorial para o mesmo patossistema, genótipos resistente (HdT
CIFC 832/2) e suscetível (C. arabica var. Caturra CIFC 19/1) inoculados com H.
vastatrix raça XXXIII, foi observado em trabalhos de citologia (LOPES, 2015). Às 17h,
após a inoculação, observaram-se as primeiras respostas citológicas induzidas pelo
fungo, houve a morte celular nas células estomáticas de ambos os genótipos. Entretanto,
os resultados sugerem impedimento do crescimento do fungo, no cafeeiro resistente, no
estágio pré-haustorial, diferente do observado no cafeeiro suscetível. Na interação
compatível, o fungo foi capaz de colonizar os tecidos do hospedeiro (LOPES, 2015).
Esse padrão de expressão observado para o Gene1, também foi descrito por
Diniz et al. (2012), que sugerem uma rápida resposta de resistência em genótipos com
interação incompatível. Entretanto, resistência pós-haustorial é geralmente a resposta
descrita para a interação cafeeiro – H. vastatrix. O fungo cessa o seu crescimento em
diferentes estágios da infecção, sendo mais frequentemente após a formação do primeiro
haustório (SILVA et al., 2002; RAMIRO et al., 2009).
Já o padrão de expressão do Gene2, é uma diminuição da expressão no genótipo
resistente que pode estar relacionada a uma resposta de defesa contra o patógeno. A
maior expressão do gene pode cooperar de alguma forma com o sucesso da infecção
pelo patógeno. Assim, em interações incompatíveis há a diminuição da expressão desse
gene, como foi observado antes das 24 hai, sugerindo também uma defesa pré-
haustorial. No genótipo suscetível observou-se um aumento da expressão do Gene2 às
24 hai, momento em que há a formação do haustório, o que pode estar permitindo maior
adaptação do fungo. Padrão de expressão semelhante ao observado da expressão do
Gene2 deste trabalho foi observado por BARROS (2016) em estudos do patossistema
soja - Phakopsora pachyrhiz em que o fungo pode induzir respostas de defesa da planta
nas horas iniciais do seu desenvolvimento, favorecendo o processo de infecção em
23
genótipos suscetíveis. No genótipo resistente vários genes foram reprimidos e no
genótipo suscetível houve a indução na expressão de diferentes genes responsivos.
Para que ocorra uma resposta efetiva das plantas contra determinado estresse,
diversos genes devem ser ativados e vários outros devem ser reprimidos. Os genes
envolvidos na defesa contra patógeno, mesmo que tenham outra função na célula
vegetal, só têm aumento no nível de expressão se for pertinente, evitando gasto de
energia desnecessário para a célula (SREE et al., 2015). Assim, outra hipótese para o
padrão de expressão do Gene2 seria a diminuição da expressão de um gene que não
auxilia nas respostas de defesa do cafeeiro durante a interação incompatível, permitindo
o aumento eficiente da expressão de outros genes associados à resistência.
O perfil de expressão encontrado por Florez et al. (2017), em relação aos
possíveis receptores like kinase (RLK), durante a interação de Coffea com o fungo H.
vastatrix, revelou que os RLKs tiveram uma diminuição na expressão relativa às 24 hai
durante a interação no genótipo resistente, em relação as amostras não inoculadas. No
genótipo suscetível foi observado um pico de expressão às 24h após a infecção. Os
autores relataram que os genes RLKs encontrados possivelmente estão envolvidos nas
primeiras respostas de defesa da planta, PTI. O mesmo foi observado para o Gene2
nesse estudo. O reconhecimento do patógeno pelos receptores das plantas desencadeia
uma cascatas de sinalização para expressão de genes que resultam na PTI, em poucas
horas após a infecção do fungo nas plantas (JONES e DANGL, 2006).
Nos estudos filogenéticos, o percentual de identidade genética entre as reads
geradas pelo sequenciamento do clone BAC 70-22F e as variedade de Coffea mostrou
valores baixos em relação a porcentagem de BLAST utilizando o genoma do clone
montado em contigs. Com esses valores obtidos o indicado é a utilização da estratégia
de montagem de novo. Pois os genomas de Coffea utilizados não são similares o
suficiente com a região genômica sequenciada do HdT CIFC 832/2 para a realização da
montagem por referência.
A similaridade genética entre o clone BAC 70-22F e a variedade Caturra (C.
arabica1), a partir da porcentagem de BLAST entre os genomas, apresentou um valor
alto em comparação com os outros resultados obtidos no alinhamento entre genomas. Já
em relação à espécie C. canephora, os valores de similaridade e de identidade genética
entre o clone BAC 70-22F e esse genoma apresentaram valores baixos. A análise de
introgressão do genoma do HdT com os seus possíveis parentais, C. canephora var.
Robusta e C. arabica, provou a existência de baixa introgressão de C. canephora no
24
HdT (SETOTAW et al., 2010). A alta similaridade genética do HdT e C. arabica foram
confirmadas por análise de introgressão do genoma, estudo da diversidade genética e
análise de agrupamento, sustentando a hipótese de que o HdT é resultante de pelo
menos dois retrocruzamentos com C. arabica (SETOTAW et al., 2010). Além disso, o
fenótipo do HdT é semelhante ao da espécie C. arabica, realizam autofecundação e
contém um número tetraploide de cromossomos semelhante ao encontrado nessa
espécie (HERRERA et al., 2014).
Essas informações disponíveis na literatura corroboram as encontradas no
presente trabalho. Entretanto, os genes de resistência (SH6-SH9) presentes no HdT, que
ainda não foram suplantados (ZAMBOLIM, 2016), vieram da introgressão do genoma
de C. canephora (HERRERA et al., 2014). Os resultados observados podem indicar que
o genoma utilizado C. canephora (clone IF 200) e o genoma C. canephora parental do
HdT (CIFC 832/2) possuem ampla diversidade genética. Pois, dentro da espécie C.
canephora há uma ampla base genética resultando em uma grande diversidade genética.
A espécie possui diferentes grupos varietais, os quais provavelmente descendem da var.
Robusta. C. arabica e o HdT apresentam maior similaridade com os genótipos do C.
canephora var. Robusta do que com var. Conilon (SOUZA, 2011).
Na análise filogenética dos genes conservados, o clone alinhou em grupos
diferentes de acordo com o gene estudado. Houve maior relação filogenética do clone
BAC 70-22F com a variedade Boubon (C. arabica3), diferente dos dados encontrados
em análises anteriores deste trabalho. No entanto, a menor similaridade foi com o
genoma de C. canephora, em conformidade com resultados já apresentados.
Nem sempre é possível associar a filogenia detectada por um gene com a filogenia
dos organismos. Fenômenos de duplicação, deleção e recombinação podem alterar
significativamente a filogenia obtida. (CALDART et al., 2016). Entretanto, as
sequências utilizadas são de genes conservados e de cópia única, distribuídos em
diferentes regiões do genoma do clone BAC 70-22F (HdT CIFC 832/2). Os resultados
observados no estudo podem estar associados à diversidade genética apresentada pelo
HdT. Setotaw et al. (2010), com o objetivo de investigar a diversidade genética do HdT,
utilizando marcadores moleculares, concluíram ao analisarem 48 acessos de um banco
de germoplasma, que o HdT apresenta considerável diversidade genética e ainda ampla
variabilidade genética. Assim, além de ser uma importante fonte de genes para
resistência a doenças, os genótipos do HdT possuem variações genéticas que são
importantes no desenvolvimento de cultivares com resistência durável.
25
As árvores filogenéticas dos dois genes candidatos a RLKs, baseada no
alinhamento de sequências proteicas dos genes e dos quatro genomas de Coffea,
revelaram que o Gene1 e o Gene2 ficaram diferentes dos genes pertencentes ao genoma
de C. canephora. Esses resultados sugerem que os dois genes pertencentes ao clone
BAC 70-22F possuem relação filogenética mais próxima com os genes do genoma de
C. arabica, assim como os resultados já apresentados neste trabalho.
O Gene2 e as três sequências agrupadas em um mesmo clado apresentaram
domínios LRR. O domínio LRR possui importante função na defesa da planta contra
patógenos, tem atuação tanto na PTI quanto na ETI. Na PTI os PRR localizados na
superfície da membrana celular ou no interior da célula geralmente apresentam o
domínio LRR. Além disso, o domínio LRR está envolvido no reconhecimento
específico de efetores de patógenos, podendo interagir com a proteína Avr ou com um
complexo de proteínas formado durante o processo de infecção (RAFIQI et al., 2009;
RIBAS et al., 2011). No RT-qPCR apresentado nesse trabalho, o Gene2 apresentou alta
expressão na interação incompatível (0 hai) e logo nas primeiras horas após a infecção o
padrão de expressão diminuiu. Esse resultado pode estar relacionado com a atuação do
gene no reconhecimento do patógeno no momento inicial da infecção. O mecanismo de
defesa PTI ocorre imediatamente após o contato com o patógeno e é considerada a
primeira linha de defesa induzida na planta, reconhecendo padrões moleculares
conservados do patógeno (JONES e DANGL, 2006). Observou-se que na interação
compatível houve um aumento da expressão do Gene2 após as 24 hai, momento em que
o haustório já se formou. Essa defesa tardia no genótipo suscetível possivelmente está
relacionada à suscetibilidade do genótipo, corroborando a importância da atuação de
proteínas que contêm o domínio LRR no reconhecimento do patógeno.
5. Conclusões
As informações obtidas no presente trabalho são relevantes para ampliar o
conhecimento sobre genes de resistência do cafeeiro à H. vastatrix e auxiliar na melhor
compreensão da diversidade genética em genótipos do HdT. Pois, permitiram
caracterizar uma região genômica do Híbrido de Timor CIFC 832/2, correspondente ao
clone BAC 70-22F e potenciais genes com associação à resistência desse cafeeiro à H.
vastatrix foram descritos. Dentre esses genes, dois genes se destacaram, sendo eles
possíveis receptores like kinases (RLKs) com perfil de expressão correspondente a uma
26
resposta de resistência pré-haustorial. As análises de expressão gênica mostraram um
perfil de expressão coerente com os já apresentados para o patossistema Coffea – H.
vastatrix. As análises filogenéticas desses genes, bem como da região genômica
clonada, demonstraram maior similaridade do clone BAC 70-22F com o genoma da
espécie C. arabica e corroboraram a diversidade genética descrita para o HdT.
27
Referências Bibliográficas
ANDREWS, S. FastQC: a quality control tool for high throughput sequence data.
2010.
AUGUSTUS. Disponível em: Acesso em 20 de março de
2018.
AVELINO, J.; CRISTANCHO, M.; GEORGIOU, S.; IMBACH, P.; AGUILAR, L.;
BORNEMANN, G.; LÄDERACH, P.; ANZUETO, F.; HRUSKA, A.J.; MORALES, C.
The coffee rust crises in Colombia and Central America (2008–2013): impacts,
plausible causes and proposed solutions. Food Security, v. 7, n. 2, p. 303-321. 2015.
BANKEVICH, A.; NURK, S.; ANTIPOV, D.; ANTIPOV, D.; GUREVICH, A. A.;
DVORKIN, M.; KULIKOV. A.S.; LESIN, V.M.; NIKOLENKO, S.I.; PHAM, S.;
PRJIBELSKI, A.D.; PYSHKIN, A.V.; SIROTKIN, A.V.; VYAHHI, N.; TESLER, G.;
ALEKSEYEV, M.A.; PEVZNER, P.A. SPAdes: a new genome assembly algorithm and
its applications to single-cell sequencing. Journal of computational biology, v. 19, n.
5, p. 455-477. 2012.
BARKA, G. D.; CAIXETA, E. T.; de ALMEIDA, R. F.; ALVARENGA, S. M.;
ZAMBOLIM, L. Differential expression of molecular rust resistance components have
distinctive profiles in Coffea arabica - Hemileia vastatrix interactions. European
journal of plant pathology, v. 149, n. 3, p.543-561. 2017.
BARROS, V. A. Vias de sinalização mediadas por ácido salicílico e metil-jasmonato
e papel de GmbZIP89 em resposta à infecção por Phakopsora pachyrhizi em
genótipos contrastantes de soja. Dissertação (Mestrado em Bioquímica Aplicada) –
Departamento de Bioquímica e Biologia Molecular, Universidade Federal de Viçosa,
Viçosa, MG. 2016.
BECK, M.; HEARD, W.; MBENGUE, M.; ROBATZEK, S. The INs and OUTs of
pattern recognition receptors at the cell surface. Current opinion in plant biology, v.
15, n. 4, p. 367-374. 2012.
BETTENCOURT, A. J. Considerações sobre o “Híbrido de Timor”. Campinas:
Instituto Agronômico, 20p. (Circular n° 23). 1973.
BETTENCOURT, A. J.; RODRIGUES JÚNIOR. C.J. Principles and practice of coffee
breeding for resistance to rust and other diseases In: CLARKE, R.J. and MACRAE, R
(Ed.). Coffee: Volume 4 – Agronomy. London: Elsevier Applied Science, cap. 6,
p.199-234. 1988.
CABRAL, P. G. C.; ZAMBOLIM, E. M.; ZAMBOLIM, L.; LELIS, T. P.; CAPUCHO,
A. S & CAIXETA, E. T. Identification of a new race of Hemileia vastatrix in Brazil.
Australasian Plant Disease Notes, v. 4, n. 1, p. 129–130. 2009.
CAÇÃO, S. M. B; SILVA, N. V.; DOMINGUES, D. S; VIEIRA, L. G. E.; DINIZ, L. E.
C.; ALVEZ, C. S. G.; ANDRADE, A. C.; CARPETIERI-PIPOLO, V.; PEREIRA,
L;F.P. Construction and characterization of a BAC library from the Coffea arabica
genotype Timor Hybrid CIFC 832/2. Genetica, v. 141, n. 4-6, p. 217-226. 2013.
28
CALDART, E. T.; MATA, H.; CANAL, C. W.; RAVAZZOLO, A. P. Phylogenetic
analysis: basic concepts and its use as a tool for virology and molecular
epidemiology. Acta Scientiae Veterinariae, 44. 2016.
CAPUCHO, A. S.; CAIXETA, E. T.; ZAMBOLIM, E. M.; ZAMBOLIM, L. Herança
da resistência do Híbrido de Timor UFV 443-03 à ferrugem do cafeeiro. Pesq. Agrop.
Bras., Brasília. 44: 276-282. 2009.
CAPUCHO, A. S.; MACIEL-ZAMBOLIM, E.; FREITAS, R.L.; HADDAD, F.;
CAIXETA, E. T.; ZAMBOLIM, L. Identification of race XXXIII of Hemileia vastatrix
on Coffea arabica Catimor derivatives in Brazil. Austral Plant Dis Notes, v. 7, p. 189–
191. 2012.
CARVALHO, V. L.; CUNHA, R. L.; SILVA, N. R. N. Alternativas de controle de
doenças do cafeeiro. Coffee Science, Lavras, v. 7, n. 1, p. 42-49, 2012.
CLARINDO, W. R.; CARVALHO, C. R. First Coffea arabica karyogram showing that
this species is a true allotetraploid. Plant Systematics and Evolution. Sep 1;274(3-
4):237. 2008.
COFFEE GENOME HUB. Disponível em: Acesso em 20 de março de 2018.
CRUZ, F.; KALAOUN, S.; NOBILE, P.; COLOMBO, C.; ALMEIDA, J.; BARROS,
L.M.; ROMANO, E.; GROSSI-DE-SÁ, M.F.; VASLIN, M.; ALVES-FERREIRA, M.
Evaluation of coffee reference genes for relative expression studies by quantitative real-
time RT-PCR. Molecular Breeding. May 1;23(4):607-16. 2009.
DINIZ, I.; TALHINHAS, P.; AZINHEIRA, H. G.; VÁRZEA, V.; MEDEIRA, C.;
MAIA, I.; PETITOT, A. S.; NICOLE; M.; FERNANDEZ, D.; do CÉU SILVA, M.
Cellular and molecular analyses of coffee resistance to Hemileia vastatrix and nonhost
resistance to Uromyces vignae in the resistance-donor genotype HDT832/2. European
journal of plant pathology. May 1;133(1):141-57. 2012.
DIOLA, V. Resistência à ferrugem do cafeeiro: mapeamento genético, físico e
análise da expressão gênica em resposta a infecção de H. vastatrix. Tese (Doutorado
em Fisiologia Vegetal) – Departamento de Biologia Vegetal, Universidade Federal de
Viçosa, Viçosa, MG. 2009.
DIOLA, V.; DE BRITO, G. G.; CAIXETA, E. T.; MACIEL-ZAMBOLIM, E.;
SAKIYAMA, N. S.; LOUREIRO, M. E.; High-density genetic mapping for coffee leaf
rust resistance. Tree genetics & genomes, 7(6), pp.1199-1208. 2011.
DODDS, P. N.; RAFIQI, M.; GAN, P. H. P.; HARDHAM, A. R.; JONES, D. A.;
ELLIS, E. G. Effectores of biotrophic fungi and oomycetes: pathogenicity factors and
triggers of host resistance. New Phytologist. 183: 993-1000. 2009.
EDWARDS, D.; BATLEY, J. Plant bioinformatics: from genome to phenome. Trends
in biotechnology, v. 22, n. 5, p. 232-237. 2004.
29
ETIENNE, H.; ANTHONY, F.; DUSSERT, S.; FERNANDEZ, D.; LASHERMES, P.;
BERTRAND, B. Biotechnological applications for the improvement of coffee (Coffea
arabica L.). In Vitro Cellular & Developmental Biology-Plant, v. 38, n. 2, p. 129-
138. 2002.
FELSENSTEIN, J. Confidence Limits on Phylogenies: An Approach Using The
Boostrap. Evolution (N Y) 39:783–791. 1985.
FERNANDES-BRUM, C. N.; REZENDE, P. M.; RIBEIRO, T. H. C.; de OLIVEIRA,
R. R.; de SOUZA CARDOSO, T. C.; do AMARAL, L. R. GOMES, M. S.; CHALFUN-
JUNIOR, A. A genome-wide analysis of the RNA-guided silencing pathway in coffee
reveals insights into its regulatory mechanisms. PloS One, v. 12, n. 4, p. e0176333.
2017.
FINN, R. D.; BATEMAN, A.; CLEMENTS, J.; COGGILL, P.; EBERHARDT, R. Y.;
EDDY, S. R.; HEGER, A.; HETHETINGGTON, K; HOLM, L.; MISTRY, J.;
SONNHAMMER, E. L. L., TADE, J.; PUNTA, M. Pfam: the protein families
database. Nucleic acids research, v. 42, n. D1, p. D222-D230. 2013.
FLOR, H.H. Current status of the gene-for-gene concept. Annual review of
phytopathology, v. 9, n. 1, p. 275-296. 1971.
FLOREZ, J. C.; MOFATTO, L. S.; DO LIVRAMENTO, R. F. L.; FERREIRA, S. S.;
ZAMBOLIM, E. M.; CARAZZOLLE, M. F.; ZAMBOLIM, L.; CAIXETA, E. T. High
throughput transcriptome analysis of coffee reveals prehaustorial resistance in response
to Hemileia vastatrix infection. Plant Molecular Biology, v. 95, p. 607-623. 2017.
FRANTZESKAKIS, L.; DI PIETRO, A.; REP, M.; SCHIRAWSKI, J.; WU, C. H.;
PANSTRUGA, R. Rapid evolution in plant–microbe interactions–a molecular genomics
perspective. New Phytologist. 2019.
GEN SCRIPT. Disponível em: Acesso em 26 de
fevereiro de 2019.
GUREVICH, A.; VYAHNI, N. QUAST: quality assessment tool for genome
assemblies. Bioinformatics, v. 29, n. 8, p. 1072-1075. 2013.
HEATH, M. C. Nonhost resistance and nonspecific plant defenses. Current opinion in
plant biology, v. 3, n. 4, p. 315-319. 2000.
HERRERA, J. C.; VILLEGAS, A. M.; GARCIA, F. A.; DEREEPER, A.; COMBES,
M. C.; POSADA, H. E.; LASHERMES, P. Genomic relationships among different
Timor hybrid (Coffea L.) accessions as revealed by SNP identification and RNA-Seq
analysis. In: Advances in Computational Biology. Springer, Cham, p. 161-168. 2014.
JONES, J. D. G.; DANGL, J. L. The plant immune system. Nature, v. 444, n. 7117, p.
323. 2006.
KUULASMAA T. Oligo Explorer 1.5. University of Easter Finland, Kuopyo, Finland.
2010.
30
KUMAR, K. R. R.; KIRTI, P. B. Differential gene expression in Arachis diogoi upon
interaction with peanut late leaf spot pathogen, Phaeoisariopsis personata and
characterization of a pathogen induced cyclophilin. Plant Mol Biol, v. 75:497–513.
2011.
KUMAR, S.; STECHER, G.; LI, M.; KNYAZ, C.; TAMURA, K. MEGA X: Molecular
Evolutionary Genetics Analysis across computing platforms. Molecular Biology and
Evolution, 35:1547-1549. 2018.
LASHERMES, P.; COMBES, M. C.; ROBERT, J.; TROUSLOT, P.; D’HONT, A.;
ANTHONY, F.; CHARRIER, A. Molecular characterisation and origin of the Coffea
arabica L. genome. Molecular and General Genetics MGG, v. 261, n. 2, p. 259-266.
1999.
LASHERMES, P.; ANDRZEJEWSKI, S.; BERTRAND, B.; COMBES, M. C.;
DUSSERT, S.; GRAZIOSI, G.; ANTHONY, F. Molecular analysis of introgressive
breeding in coffee (Coffea arabica L.). Theoretical and applied genetics, v. 100, n. 1,
p. 139-146. 2000.
LIN, C.; MUELLER, L. A.; CARTHY, J. M.; CROUZILLAT, D.; PETIARD, D.;
TANKSLEY, S. D. Coffee and tomato share common gene repertoires as revealed by
deep sequencing of seed and cherry transcripts. Theoretical and applied genetics, v.
112, n. 1, p. 114-130. 2005.
LOHSE, M.; BOLGER, A. M.; NAGEL, A.; FERNIE, A. R.; LUNN, J. E.; STITT, M.;
USADEL, B. R obi NA: a user-friendly, integrated software solution for RNA-Seq-
based transcriptomics. Nucleic Acids Res., v. 40, n.1, p. 622-627. 2012.
LOPES, R. L. F. Análise Citológica e Perfil de Expressão Gênica de Hemileia
vastatrix (RaçaXXXIII) na Interação Com o Cafeeiro. Tese (Doutorado em Genética
e Melhoramento) – Departamento de Fitotecnia, Universidade Federal de Viçosa,
Viçosa, MG. 2015.
MENDGEN, K., HAHN, M. Plant infection and the establishment of fungal
biotrophy. Trends in plant science, v. 7, n. 8, p. 352-356. 2002.
MICHNO, J. M.; STUPAR, R. M. The importance of genotype identity, genetic
heterogeneity, and bioinformatic handling for properly assessing genomic variation in
transgenic plants. BMC biotechnology, v. 18, n. 1, p. 38. 2018.
MIKHEENKO, A.; PRJIBELSKI, A.; SAVELIEV, V.; ANTIPOV, D.; GUREVICH,
A. Avaliação de montagem de genoma versátil com QUAST-LG. Bioinformática 34
(13): i142-i150. 2018.
MOTULSKY, H. J. Prism 5 Statistics Guide, Software GraphPad. Inc., San Diego
CA. 2007.
NATIONAL CENTER FOR BIOTECHNOLOGY IMFORMATION. Disponível em:
Acesso em 20 de março de 2018.
31
NORONHA-WAGNER, M.; BETTENCOURT, A. Genetic study of the resistance of
coffea spp. to leaf rust: i. identification and behavior of four factors conditioning disease
reaction in Coffea arabica to twelve physiologic races of Hemileia vastatrix. Canadian
Journal of Botany, v. 45, n. 11, p. 2021-2031. 1967.
PESTANA, K. N.; CAPUCHO, A. S.; CAIXETA, E. T.; DE ALMEIDA, D. P.;
ZAMBOLIM, E. M.; CRUZ, C. D.; ZAMBOLIM, L.; PEREIRA, A. A.; OLIVEIRA,
A. C. B.; SAKIYAMA, N. S. Inheritance study and linkage mapping of resistance loci
to Hemileia vastatrix in Híbrido de Timor UFV 443-03. Tree genetics & genomes, v.
11, n. 4, p. 72. 2015.
RAFIQI, M.; BERNOUX, M.; ELLIS, J. G.; DODDS, P. N. In the trenches of plant
pathogen recognition: Role of NB-LRR proteins. In: Seminars in cell &
developmental biology. Academic Press, p. 1017-1024. 2009.
RAMIRO, D. A.; Escoute, J.; Petitot, A. S.; Nicole, M.; Maluf, M. P.; Fernandez, D.
Biphasic haustorial differentiation of coffee rust (Hemileia vastatrix race II) associated
with defence responses in resistant and susceptible coffee cultivars. Plant Pathology, v.
58, n. 5, p. 944-955. 2009.
REDDY, A. C.; NARESH, P. The crucial role of R-genes/RGAs in host-microbial
interactions and plant immunity. Research Journal of Biotechnology, vol, v. 13, p. 4.
2018.
RIBAS, A. F.; CENCI, A.; COMBES, M. C.; ETIENNE, H.; LASHERMES, P.
Organization and molecular evolution of a disease-resistance gene cluster in coffee
trees. BMC genomics, v. 12, n. 1, p. 240. 2011.
SEKHWAL, M.; LI, P.; LAM, I.; WANG, X.; CLOUTIER, S.; YOU, F. Disease
resistance gene analogs (RGAs) in plants. International journal of molecular
sciences, v. 16, n. 8, p. 19248-19290. 2015.
SETOTAW, T. A.; TEXEIRA, C. E.; FEREIRE, P. G; ZAMBOLIM, E. M.;
PEREIRA, A. A; SAKIYAMA, N. S. Breeding potential and genetic diversity of"
Híbrido do Timor" coffee evaluated by molecular markers. Crop breeding and applied
biotechnology, v. 10, n. 4, p. 298-304. 2010.
SILVA, M. C.; NICOLE, M.; GUERRA-GUIMARÃES, L.; RODRIGUES JR, C. J.
Hypersensitive cell death and post-haustorial defence responses arrest the orange rust
(Hemileia vastatrix) growth in resistant coffee leaves. Physiological and Molecular
Plant Pathology, v. 60, n. 4, p. 169-183. 2002.
SILVA, R. A.; ZAMBOLIM, L.; CASTRO, I. S. L.; RODRIGUES, H. S.; CRUZ, C.
D.; CAIXETA, E. T. The Híbrido de Timor germplasm: identification of molecular
diversity and resistance sources to coffee berry disease and leaf rust. Euphytica, v. 214,
n. 9, p. 153. 2018.
SOUZA, F. F. Diversidade genética, estrutura populacional e mapeamento
associativo em Coffea canephora. Tese (Doutorado em Genética e Melhoramento) –
Departamento de Fitotecnia, Universidade Federal de Viçosa, Viçosa, MG. 2011.
32
SOUSA, T. V; CAIXETA, E. T.; ALKIMIM, E. R.; DE OLIVEIRA, A. C. B.;
PEREIRA, A. A.; SAKIYAMA, N. S. JÚNIOR, M. F. R. R.; ZAMBOLIM, L.
Population structure and genetic diversity of coffee progenies derived from Catuaí and
Híbrido de Timor revealed by genome-wide SNP marker. Tree genetics & genomes, v.
13, n. 6, p. 124. 2017.
SREE, K.; SOWJANYA; R. A. J. A. M.; MANCHIKATLA, V. Genetic engineering
strategies for biotic stress tolerance in plants. In: Plant Biology and Biotechnology.
Springer, New Delhi, p. 611-622. 2015.
STANKE, M.; STEINKAMP, R.; WAACK, S.; MORGENSTERN, B. AUGUSTUS: a
web server for gene finding in eukaryotes. Nucleic acids research, v. 32, n. suppl 2, p.
W309-W312. 2004.
TALHINHAS, P.; BATISTA, D.; DINIZ, I.; VIEIRA, A.; SILVA, D.N.; LOUREIRO,
A., TAVERES, S.; PEREIRA, A.P.; AZINHEIRA, H. G.; GUERRERA-GUINARÃES,
L.; VÁRZEA, V.; SILVA, M. C. The coffee leaf rust pathogen Hemileia vastatrix: one
and a half centuries around the tropics. Molecular plant pathology, v. 18, n. 8, p.
1039-1051. 2017.
TAMURA, K.; NEI, M. Estimation of the number of nucleotide substitutions in the
control region of mitochondrial DNA in humans and chimpanzees. Mol Biol Evol.
1993.
TRAPNELL, C.; PACHTER, L.; SALZBERG, S. L. TopHat: discovering splice
junctions with RNA-Seq. Bioinformatics, v. 25, n. 9, p. 1105-1111. 2009.
ZAMBOLIM, L. Current status and management of coffee leaf rust in Brazil. Tropical
Plant Pathology, v. 41, n. 1, p. 1-8. 2016.
WORLD COFFEE RESEARCH. Disponível em: <(https://worldcoffeeresearch.org/>
Acesso em 20 de março de 2018.
33
ORFs Locos Genoma %ID E-value Cobertura Anotação
NODE_1_length_6472_cov_8.48366:g1.t1 NC_039902.1 3c C. arabica 49.55 0.0 98.00 uncharacterized protein LOC113735882
NODE_1_length_6472_cov_8.48366:g1.t1 chr10 C. canephora 32.48 4,00E-26 15.00 Putative Probable LRR receptor-like serine/threonine-protein kinase At4g08850
NODE_1_length_6472_cov_8.48366:g1.t1 NC_040035.1 1eu C. eugenioides 61.85 0.0 60.00 uncharacterized protein LOC113769237
NODE_1_length_6472_cov_8.48366:g1.t2 NC_039902.1 3c C. arabica 57.96 0.0 61.00 uncharacterized protein LOC113735882
NODE_1_length_6472_cov_8.48366:g1.t2 chr10 C. canephora 32.48 5,00E-26 15.00 Putative Probable LRR receptor-like serine/threonine-protein kinase At4g08850
NODE_1_length_6472_cov_8.48366:g1.t2 NC_040035.1 1eu C. eugenioides 62.34 0.0 61.00 uncharacterized protein LOC113769237
NODE_2_length_6312_cov_4.20642:g2.t1 NC_039915.1 9e C. arabica 75.38 1,00E-60 57.00 uncharacterized protein LOC113709996
NODE_2_length_6312_cov_4.20642:g2.t1 chr0 C. canephora 58.33 8,00E-18 31.00 Hypothetical protein
NODE_2_length_6312_cov_4.20642:g2.t1 NC_040037.1 3eu C. eugenioides 73.61 9,00E-28 31.00 uncharacterized protein LOC113766718
NODE_10_length_2753_cov_2.94619:g8.t1 NC_039902.1 3c C. arabica 65.03 0.0 95.00 uncharacterized protein LOC113735882
NODE_10_length_2753_cov_2.94619:g8.t1 chr10 C. canephora 36.55 5,00E-27 25.00 Putative Probable LRR receptor-like serine/threonine-protein kinase At4g08850
NODE_10_length_2753_cov_2.94619:g8.t1 NC_040036.1 2eu C. eugenioides 73.94 0.0 56.00 uncharacterized protein LOC113760043
NODE_12_length_2445_cov_5.93412:g9.t1 NC_039901.1 2e C. arabica 61.18 1,00E-25 36.00 uncharacterized protein LOC113729084
NODE_12_length_2445_cov_5.93412:g9.t1 NC_040036.1 2eu C. eugenioides 61.18 6,00E-26 36.00 uncharacterized protein LOC113759824
NODE_17_length_2074_cov_4.61592:g10.t1 NC_039915.1 9e C. arabica 40.62 3,00E-40 44.00 uncharacterized protein LOC113709957
NODE_17_length_2074_cov_4.61592:g10.t1 NW_020863778.1 scaffold C. eugenioides 42.55 2,00E-40 37.00 uncharacterized protein LOC113757670
NODE_17_length_2074_cov_4.61592:g10.t2 NC_039915.1 9e C. arabica 40.62 2,00E-40 45.00 uncharacterized protein LOC113709957
NODE_17_length_2074_cov_4.61592:g10.t2 NW_020863778.1 scaffold C. eugenioides 42.55 2,00E-40 37.00 uncharacterized protein LOC113757670
NODE_24_length_1689_cov_2.3995:g13.t1 NC_039914.1 9c C. arabica 84.11 5,00E-84 53.00 serologically defined colon cancer antigen 8 homolog
NODE_24_length_1689_cov_2.3995:g13.t1 NC_040035.1 1eu C. eugenioides 60.56 4,00E-54 64.00 uncharacterized protein LOC113770239
NODE_24_length_1689_cov_2.3995:g13.t2 NC_039914.1 9c C. arabica 84.11 1,00E-83 52.00 serologically defined colon cancer antigen 8 homolog
NODE_24_length_1689_cov_2.3995:g13.t2 NC_040035.1 1eu C. eugenioides 60.56 8,00E-54 63.00 uncharacterized protein LOC113770239
NODE_29_length_1476_cov_2.56469:g16.t1 NC_039903.1 3e C. arabica 58.70 9,00E-167 100.00 uncharacterized protein LOC113737292
NODE_29_length_1476_cov_2.56469:g16.t1 NC_040044.1 10eu C. eugenioides 60.22 7,00E-170 100.00 uncharacterized protein LOC113750488
NODE_29_length_1476_cov_2.56469:g16.t2 NC_039903.1 3e C. arabica 58.70 1,00E-166 97.00 uncharacterized protein LOC113737292
NODE_29_length_1476_cov_2.56469:g16.t2 NC_040044.1 10eu C. eugenioides 60.22 2,00E-169 97.00 uncharacterized protein LOC113750488
NODE_44_length_1234_cov_3.88678:g21.t1 NC_039899.1 1e C. arabica 71.78 0.0 100.00 uncharacterized protein LOC113692421
NODE_44_length_1234_cov_3.88678:g21.t1 NC_040035.1 1eu C. eugenioides 72.26 0.0 100.00 uncharacterized protein LOC113768532
NODE_61_length_936_cov_2.05937:g27.t1 NC_039905.1 4e C. arabica 71.88 4,00E-88 100.00 protein STRICTOSIDINE SYNTHASE-LIKE 12-like isoform X2
Apêndice A. Anotação gênica do clone BAC 70-22F utilizando a ferramenta BLAST. Foram anotados 991 genes. 340 genes anotados em similaridade com C. arabica (var. Caturra). 337 genes anotados em similaridade com C. eugenioides.
314 genes anotados em similaridade com C.canephora (clone IF 200).
34
NODE_61_length_936_cov_2.05937:g27.t1 chr4 C. canephora 69.79 1,00E-81 100.00 Putative Strictosidine synthase 1
NODE_61_length_936_cov_2.05937:g27.t1 NC_040038.1 4eu C. eugenioides 61.83 2,00E-69 96.00 protein STRICTOSIDINE SYNTHASE-LIKE 11-like
NODE_61_length_936_cov_2.05937:g27.t2 NC_039905.1 4e C. arabica 72.41 6,00E-96 93.00 protein STRICTOSIDINE SYNTHASE-LIKE 12-like isoform X2
NODE_61_length_936_cov_2.05937:g27.t2 chr4 C. canephora 69.95 1,00E-82 88.00 Putative Strictosidine synthase 1
NODE_61_length_936_cov_2.05937:g27.t2 NC_040038.1 4eu C. eugenioides 61.38 5,00E-71 87.00 protein STRICTOSIDINE SYNTHASE-LIKE 11-like
NODE_62_length_907_cov_1.42651:g28.t1 NC_039912.1 8e C. arabica 80.62 4,00E-48 100.00 uncharacterized protein LOC113704544
NODE_62_length_907_cov_1.42651:g28.t1 chr0 C. canephora 67.16 2,00E-28 53.00 Hypothetical protein
NODE_62_length_907_cov_1.42651:g28.t1 NW_020864190.1 scaffold C. eugenioides 76.98 2,00E-47 100.00 uncharacterized protein LOC113758088
NODE_74_length_772_cov_1.49784:g29.t1 NC_039904.1 4c C. arabica 100.00 1,00E-42 90.00 diphthine methyltransferase homolog
NODE_74_length_772_cov_1.49784:g29.t1 chr4 C. canephora 100.00 4,00E-43 90.00 Putative WD repeat-containing protein 85 homolog
NODE_74_length_772_cov_1.49784:g29.t1 NC_040038.1 4eu C. eugenioides 100.00 4,00E-43 90.00 diphthine methyltransferase homolog isoform X2
NODE_88_length_724_cov_1.32921:g35.t1 NC_039913.1 8c C. arabica 58.33 9,00E-59 96.00 delta-aminolevulinic acid dehydratase%2C chloroplastic-like
NODE_88_length_724_cov_1.32921:g35.t1 chr8 C. canephora 58.33 3,00E-58 96.00 Delta-aminolevulinic acid dehydratase%2C chloroplastic
NODE_88_length_724_cov_1.32921:g35.t1 NC_040038.1 4eu C. eugenioides 58.33 5,00E-59 96.00 delta-aminolevulinic acid dehydratase%2C chloroplastic-like
NODE_95_length_683_cov_1.15347:g39.t1 NW_020850478.1 scaffold C. arabica 48.78 5,00E-27 50.00 monothiol glutaredoxin-S7%2C chloroplastic
NODE_95_length_683_cov_1.15347:g39.t1 chr7 C. canephora 48.78 1,00E-26 50.00 Uncharacterized monothiol glutaredoxin ycf64-like
NODE_95_length_683_cov_1.15347:g39.t1 NC_040045.1 11eu 11eu C. eugenioides 48.78 3,00E-27 50.00 monothiol glutaredoxin-S7%2C chloroplastic
NODE_100_length_671_cov_1.90741:g42.t1 NC_039901.1 2e C. arabica 54.69 1,00E-18 44.00 glycine-rich protein 2-like
NODE_100_length_671_cov_1.90741:g42.t1 chr2 C. canephora 54.69 5,00E-19 44.00 Glycine-rich protein 2b
NODE_100_length_671_cov_1.90741:g42.t1 NC_040036.1 2eu C. eugenioides 54.69 8,00E-19 44.00 glycine-rich protein 2
NODE_104_length_660_cov_1.56261:g43.t1 NC_039904.1 4c C. arabica 35.41 7,00E-29 95.00 aldehyde dehydrogenase family 2 member B4%2C mitochondrial-like
NODE_104_length_660_cov_1.56261:g43.t1 chr4 C. canephora 35.41 2,00E-29 95.00 Aldehyde dehydrogenase family 2 member B4%2C mitochondrial
NODE_104_length_660_cov_1.56261:g43.t1 NC_040038.1 4eu C. eugenioides 35.41 6,00E-29 95.00 aldehyde dehydrogenase family 2 member B4%2C mitochondrial-like
NODE_105_length_656_cov_1.3886:g44.t1 NC_039903.1 3e C. arabica 38.02 2,00E-21 93.00 carboxyl-terminal-processing peptidase 2%2C chloroplastic-like isoform X1
NODE_105_length_656_cov_1.3886:g44.t1 chr3 C. canephora 38.54 3,00E-23 93.00 Carboxyl-terminal-processing protease
NODE_105_length_656_cov_1.3886:g44.t1 NC_040037.1 3eu C. eugenioides 38.54 4,00E-22 93.00 carboxyl-terminal-processing peptidase 2%2C chloroplastic isoform X1
NODE_110_length_645_cov_1.68486:g49.t1 NC_039903.1 3e C. arabica 57.38 2,00E-17 75.00 uncharacterized protein LOC113737438
NODE_110_length_645_cov_1.68486:g49.t1 NC_040041.1 7eu C. eugenioides 53.97 1,00E-17 77.00 uncharacterized protein LOC113777170
NODE_117_length_632_cov_2.09009:g53.t1 NC_039907.1 5c C. arabica 29.58 3,00E-15 90.00 probable lipid-A-disaccharide synthase%2C mitochondrial isoform X2
NODE_117_length_632_cov_2.09009:g53.t1 chr5 C. canephora 29.44 6,00E-16 90.00 Putative Lipid-A-disaccharide synthase
NODE_117_length_632_cov_2.09009:g53.t1 NC_040039.1 5eu C. eugenioides 29.11 5,00E-15 90.00 probable lipid-A-disaccharide synthase%2C mitochondrial isoform X1
NODE_118_length_632_cov_1.58378:g54.t1 NC_039907.1 5c C. arabica 22.83 2,00E-10 96.00 DUF21 domain-containing protein At1g55930%2C chloroplastic-like isoform X3
NODE_118_length_632_cov_1.58378:g54.t1 chr5 C. canephora 23.74 4,00E-10 87.00 DUF21 domain-containing protein At1g55930%2C chloroplastic
NODE_118_length_632_cov_1.58378:g54.t1 NC_040039.1 5eu C. eugenioides 25.73 9,00E-11 76.00 putative DUF21 domain-containing protein At3g13070%2C chloroplastic isoform X2
35
NODE_128_length_614_cov_1.73557:g61.t1 NC_039911.1 7e C. arabica 27.73 8,00E-08 99.00 cellulose synthase A catalytic subunit 5 [UDP-forming]-like
NODE_128_length_614_cov_1.73557:g61.t1 chr7 C. canephora 27.98 1,00E-09 98.00 Cellulose synthase A catalytic subunit 5 [UDP-forming]
NODE_128_length_614_cov_1.73557:g61.t1 NC_040041.1 7eu C. eugenioides 27.73 4,00E-08 99.00 cellulose synthase A catalytic subunit 5 [UDP-forming]-like
NODE_129_length_613_cov_2.95522:g62.t1 NC_039905.1 4e C. arabica 98.40 6,00E-54 100.00 homeobox protein knotted-1-like 1
NODE_129_length_613_cov_2.95522:g62.t1 chr4 C. canephora 100.00 1,00E-45 86.00 Putative uncharacterized protein
NODE_129_length_613_cov_2.95522:g62.t1 NC_040038.1 4eu C. eugenioides 98.40 3,00E-54 100.00 homeobox protein knotted-1-like 1
NODE_132_length_607_cov_3.49811:g65.t1 NC_039904.1 4c C. arabica 93.10 3,00E-48 97.00 uncharacterized protein LOC113739892 isoform X1
NODE_132_length_607_cov_3.49811:g65.t1 chr4 C. canephora 93.10 1,00E-48 97.00 unknown protein%3B FUNCTIONS IN
NODE_132_length_607_cov_3.49811:g65.t1 NC_040038.1 4eu C. eugenioides 93.10 2,00E-48 97.00 uncharacterized protein LOC113768344 isoform X1
NODE_132_length_607_cov_3.49811:g65.t2 NC_039904.1 4c C. arabica 100.00 8,00E-48 100.00 uncharacterized protein LOC113739892 isoform X1
NODE_132_length_607_cov_3.49811:g65.t2 chr4 C. canephora 100.00 3,00E-48 100.00 unknown protein%3B FUNCTIONS IN
NODE_132_length_607_cov_3.49811:g65.t2 NC_040038.1 4eu C. eugenioides 100.00 4,00E-48 100.00 uncharacterized protein LOC113768344 isoform X1
NODE_140_length_596_cov_1.30829:g70.t1 NC_039908.1 6c C. arabica 29.65 3,00E-21 93.00 thioredoxin reductase NTRC-like
NODE_140_length_596_cov_1.30829:g70.t1 chr6 C. canephora 29.65 9,00E-22 93.00 NADPH-dependent thioredoxin reductase 3
NODE_140_length_596_cov_1.30829:g70.t1 NC_040040.1 6eu C. eugenioides 29.65 5,00E-22 93.00 thioredoxin reductase NTRC
NODE_144_length_589_cov_2.50195:g74.t1 NC_039918.1 11c C. arabica 29.56 2,00E-16 98.00 spermidine synthase-like
NODE_144_length_589_cov_2.50195:g74.t1 chr2 C. canephora 25.47 4,00E-12 96.00 Spermine synthase
NODE_144_length_589_cov_2.50195:g74.t1 NC_040045.1 11eu 11eu C. eugenioides 28.93 7,00E-16 98.00 spermidine synthase
NODE_146_length_588_cov_1.42661:g76.t1 NC_039898.1 1c C. arabica 36.95 5,00E-31 95.00 lysosomal beta glucosidase-like
NODE_146_length_588_cov_1.42661:g76.t1 chr1 C. canephora 36.95 2,00E-31 95.00 Putative Lysosomal beta glucosidase
NODE_146_length_588_cov_1.42661:g76.t1 NC_040035.1 1eu C. eugenioides 37.50 7,00E-31 89.00 lysosomal beta glucosidase-like
NODE_154_length_576_cov_1.46894:g81.t1 NC_039900.1 2c C. arabica 27.98 1,00E-16 91.00 ATP-dependent DNA helicase SRS2-like protein At4g25120 isoform X3
NODE_154_length_576_cov_1.46894:g81.t1 chr0 C. canephora 27.98 5,00E-17 91.00 Putative ATP-dependent DNA helicase pcrA
NODE_154_length_576_cov_1.46894:g81.t1 NC_040035.1 1eu C. eugenioides 27.98 3,00E-17 91.00 ATP-dependent DNA helicase SRS2-like protein At4g25120
NODE_168_length_551_cov_1.50422:g90.t1 NC_039910.1 7c C. arabica 36.75 4,00E-14 59.00 ATP-dependent 6-phosphofructokinase 5%2C chloroplastic-like
NODE_168_length_551_cov_1.50422:g90.t1 chr7 C. canephora 36.75 1,00E-14 59.00 6-phosphofructokinase 5%2C chloroplastic
NODE_168_length_551_cov_1.50422:g90.t1 NC_040041.1 7eu C. eugenioides 36.75 2,00E-14 59.00 ATP-dependent 6-phosphofructokinase 5%2C chloroplastic
NODE_172_length_548_cov_3.2017:g92.t1 NC_039905.1 4e C. arabica 95.45 1,00E-24 100.00 uncharacterized protein LOC113742131 isoform X1
NODE_172_length_548_cov_3.2017:g92.t1 chr4 C. canephora 95.45 4,00E-25 100.00 unknown protein%3B FUNCTIONS IN
NODE_172_length_548_cov_3.2017:g92.t1 NC_040038.1 4eu C. eugenioides 95.45 9,00E-25 100.00 uncharacterized protein LOC113768344 isoform X2
NODE_173_length_548_cov_1.32696:g93.t1 NC_039915.1 9e C. arabica 100.00 2,00E-100 100.00 uncharacterized protein LOC113709986
NODE_173_length_548_cov_1.32696:g93.t1 chr2 C. canephora 53.30 2,00E-46 100.00 Putative DNA helicase PIF1%2C ATP-dependent
NODE_173_length_548_cov_1.32696:g93.t1 NC_040038.1 4eu C. eugenioides 100.00 5,00E-99 100.00 uncharacterized protein LOC113769142
NODE_174_length_548_cov_1.52654:g94.t1 NC_039910.1 7c C. arabica 81.87 5,00E-110 100.00 uncharacterized protein LOC113699534
36
NODE_174_length_548_cov_1.52654:g94.t1 chr10 C. canephora 40.00 6,00E-14 35.00 Putative Probable LRR receptor-like serine/threonine-protein kinase At4g08850
NODE_174_length_548_cov_1.52654:g94.t1 NW_020862338.1 scaffold C. eugenioides 54.95 5,00E-74 100.00 uncharacterized protein LOC113756011
NODE_175_length_546_cov_1.54371:g95.t1 NC_039900.1 2c C. arabica 34.57 3,00E-08 79.00 LOW QUALITY PROTEIN: CLP protease regulatory subunit CLPX1%2C mitochondrial-like
NODE_175_length_546_cov_1.54371:g95.t1 chr2 C. canephora 34.57 7,00E-09 79.00 ATP-dependent Clp protease ATP-binding subunit ClpX
NODE_175_length_546_cov_1.54371:g95.t1 NC_040036.1 2eu C. eugenioides 34.57 2,00E-08 79.00 CLP protease regulatory subunit CLPX1%2C mitochondrial
NODE_176_length_545_cov_2.76282:g96.t1 NC_039900.1 2c C. arabica 67.39 7,00E-38 100.00 uncharacterized protein LOC113723844
NODE_176_length_545_cov_2.76282:g96.t1 chr2 C. canephora 49.45 3,00E-21 97.00 Putative Pol-polyprotein
NODE_176_length_545_cov_2.76282:g96.t1 NC_040035.1 1eu C. eugenioides 67.39 4,00E-37 100.00 uncharacterized protein K02A2.6-like
NODE_185_length_535_cov_1.33188:g100.t1 NC_039900.1 2c C. arabica 39.60 9,00E-18 93.00 3-methyl-2-oxobutanoate hydroxymethyltransferase 2%2C mitochondrial-like isoform X2
NODE_185_length_535_cov_1.33188:g100.t1 chr2 C. canephora 39.24 9,00E-18 98.00 3-methyl-2-oxobutanoate hydroxymethyltransferase
NODE_185_length_535_cov_1.33188:g100.t1 NC_040036.1 2eu C. eugenioides 39.60 6,00E-18 93.00 3-methyl-2-oxobutanoate hydroxymethyltransferase 2%2C mitochondrial-like isoform X2
NODE_186_length_534_cov_1.5186:g101.t1 NC_039918.1 11c C. arabica 47.50 1,00E-17 64.00 probable aquaporin NIP-type
NODE_186_length_534_cov_1.5186:g101.t1 chr7 C. canephora 42.50 2,00E-16 64.00 Probable aquaporin NIP-type
NODE_186_length_534_cov_1.5186:g101.t1 NC_040036.1 2eu C. eugenioides 45.57 2,00E-17 63.00 aquaporin NIP1-1-like
NODE_189_length_533_cov_1.01096:g103.t1 NC_039906.1 5e C. arabica 29.38 7,00E-11 90.00 aconitate hydratase%2C cytoplasmic
NODE_189_length_533_cov_1.01096:g103.t1 chr5 C. canephora 29.38 3,00E-11 90.00 Aconitate hydratase 2%2C mitochondrial
NODE_189_length_533_cov_1.01096:g103.t1 NC_040039.1 5eu C. eugenioides 27.93 1,00E-10 92.00 putative aconitate hydratase%2C cytoplasmic
NODE_192_length_532_cov_1.53407:g106.t1 NW_020849470.1 scaffold C. arabica 100.00 2,00E-108 100.00 uncharacterized protein LOC113720575
NODE_192_length_532_cov_1.53407:g106.t1 chr3 C. canephora 58.94 5,00E-58 85.00 Hypothetical protein
NODE_192_length_532_cov_1.53407:g106.t1 NC_040038.1 4eu C. eugenioides 98.30 6,00E-107 100.00 uncharacterized protein LOC113769142
NODE_204_length_525_cov_1.18973:g116.t1 NC_039918.1 11c C. arabica 36.97 3,00E-09 72.00 LOW QUALITY PROTEIN: inorganic phosphate transporter 2-1%2C chloroplastic-like
NODE_204_length_525_cov_1.18973:g116.t1 chr11 C. canephora 41.76 8,00E-09 54.00 Inorganic phosphate transporter 2-1%2C chloroplastic
NODE_204_length_525_cov_1.18973:g116.t1 NC_040045.1 11eu 11eu C. eugenioides 36.89 6,00E-09 62.00 inorganic phosphate transporter 2-1%2C chloroplastic
NODE_207_length_522_cov_1.56404:g117.t1 NC_039916.1 10e C. arabica 58.82 9,00E-58 100.00 protein translocase subunit SECA2%2C chloroplastic-like
NODE_207_length_522_cov_1.56404:g117.t1 chr10 C. canephora 58.82 1,00E-59 100.00 Protein translocase subunit SECA2%2C chloroplastic
NODE_207_length_522_cov_1.56404:g117.t1 NC_040035.1 1eu C. eugenioides 66.23 3,00E-60 92.00 protein translocase subunit SecA%2C chloroplastic
NODE_211_length_520_cov_1.92325:g121.t1 NC_039898.1 1c C. arabica 44.44 2,00E-07 36.00 phosphomethylpyrimidine synthase%2C chloroplastic isoform X3
NODE_211_length_520_cov_1.92325:g121.t1 chr1 C. canephora 44.44 8,00E-08 36.00 Phosphomethylpyrimidine synthase%2C chloroplastic
NODE_211_length_520_cov_1.92325:g121.t1 NC_040035.1 1eu C. eugenioides 44.44 1,00E-07 36.00 phosphomethylpyrimidine synthase%2C chloroplastic isoform X3
NODE_213_length_518_cov_1.67574:g123.t1 NC_039909.1 6e C. arabica 42.20 5,00E-23 94.00 iron-sulfur assembly protein IscA-like 2%2C mitochondrial isoform X1
NODE_213_length_518_cov_1.67574:g123.t1 chr6 C. canephora 40.37 7,00E-23 94.00 Iron-sulfur assembly protein IscA-like 2%2C mitochondrial
NODE_213_length_518_cov_1.67574:g123.t1 NC_040040.1 6eu C. eugenioides 41.28 4,00E-23 94.00 iron-sulfur assembly protein IscA-like 2%2C mitochondrial
NODE_216_length_517_cov_1.84091:g125.t1 NC_039910.1 7c C. arabica 79.49 8,00E-15 37.00 uncharacterized protein LOC113699907
NODE_216_length_517_cov_1.84091:g125.t1 NC_040042.1 8eu C. eugenioides 76.92 1,00E-12 37.00 uncharacterized protein LOC113780732
37
NODE_217_length_515_cov_1.00457:g126.t1 NC_039900.1 2c C. arabica 37.97 1,00E-31 99.00 probable tRNA N6-adenosine threonylcarbamoyltransferase%2C mitochondrial
NODE_217_length_515_cov_1.00457:g126.t1 chr2 C. canephora 37.97 3,00E-32 99.00 Putative Probable tRNA threonylcarbamoyladenosine biosynthesis protein osgepl1
NODE_217_length_515_cov_1.00457:g126.t1 NC_040036.1 2eu C. eugenioides 37.97 7,00E-32 99.00 probable tRNA N6-adenosine threonylcarbamoyltransferase%2C mitochondrial
NODE_222_length_512_cov_3.11034:g130.t1 NC_039909.1 6e C. arabica 84.62 1,00E-95 99.00 uncharacterized protein LOC113696749
NODE_222_length_512_cov_3.11034:g130.t1 chr7 C. canephora 64.71 9,00E-08 20.00 Putative Late blight resistance protein R1
NODE_222_length_512_cov_3.11034:g130.t1 NW_020864084.1 scaffold C. eugenioides 84.62 3,00E-95 99.00 uncharacterized protein LOC113758021
NODE_228_length_508_cov_1.34339:g133.t1 chr2 C. canephora 34.57 5,00E-08 98.00 Putative Epimerase family protein slr1223
NODE_228_length_508_cov_1.34339:g133.t1 NC_040036.1 2eu C. eugenioides 34.57 1,00E-07 98.00 epimerase family protein SDR39U1 homolog%2C chloroplastic isoform X1
NODE_233_length_505_cov_1.89019:g135.t1 NC_039902.1 3c C. arabica 42.01 4,00E-33 98.00 probable uridine nucleosidase 2 isoform X1
NODE_233_length_505_cov_1.89019:g135.t1 chr3 C. canephora 42.01 2,00E-33 98.00 Probable uridine nucleosidase 2
NODE_233_length_505_cov_1.89019:g135.t1 NC_040037.1 3eu C. eugenioides 42.60 1,00E-33 98.00 probable uridine nucleosidase 2
NODE_235_length_503_cov_1.07981:g137.t1 NC_039900.1 2c C. arabica 55.38 1,00E-38 77.00 glutamate synthase [NADH]%2C amyloplastic-like isoform X2
NODE_2