O café é uma das commodities agrícolas mais importantes mundialmente. Programas de melhoramento genético que visam a introdução de caracteres para obtenção de novas variedades com características agronômicas superiores, como floração uniforme, rendimento, tamanho do grão, qualidade da bebida, menor teor de cafeína e resistência à doenças e à seca estão em andamento à décadas. Contudo, com um número considerável de sequências gênicas disponíveis nos bancos de dados Coffea spp., a identificação e a caracterização de novos genes com função desconhecida (no hits) é viável e indispensável. O objetivo com este trabalho consistiu em identificar e caracterizar funcionalmente, por meio de análises in silico e por qPCR da expressão gênica, no hits encontrados nas bases de dados do café. Para as análises in silico os no hits foram identificados por meio da busca por similaridade nos bancos de dados do NCBI. Bibliotecas de Coffea arabica e Coffea canephora de diferentes tecidos foram geradas a partir dos dados de sequenciamento utilizando o método Sanger e o método 454. Foi realizado um Northern eletrônico dos no hits nas diferentes bibliotecas de café. Para os ensaios de qPCR o material vegetal utilizado foi proveniente de diferentes tecidos (folhas, raízes, frutos e meristemas) das espécies de C. arabica e C. canephora, submetidos à diferentes condições biológicas (estresse biótico e abiótico) e frutos em estádios de desenvolvimento inicial, intermediário e tardio. Mil quinhentos e sessenta e oito genes órfãos foram identificados e caracterizados nas análises in silico, de acordo com as bibliotecas em que foram expressos. Com isso, foram selecionados e testados em qPCR, dezessete genes órfãos potencialmente envolvidos na tolerância a estresses bióticos e abióticos, assim como genes órfãos implicados no desenvolvimento do fruto de café. Estes genes responderam diferencialmente nos tecidos e condições biológicas analisadas, corroborando com as análises in silico previamente apresentadas e oferecendo indícios de uma provável participação em processos biológicos específicos do cafeeiro.
Coffee is one of the most important agricultural commodities worldwide. Breeding programs aimed at introducing new characters to produce novel varieties with superior agronomic traits, such as, uniform flowering, yield, grain size, beverage quality, lower caffeine content, as well as, disease and drought resistance have been ongoing for several decades. However, with a large number of gene sequences available in Coffea spp. databases, the identification and characterization of novel genes with unknown function (no hits) are feasible and necessary. The aim of this study was to identify and functionally characterize no hits found in coffee databases, using in silico analysis and qPCR gene expression. For in silico analyses, no hits were identified by similarity search in NCBI databases. Coffea arabica and Coffea canephora libraries from different tissues were generated by sequencing data using the Sanger and 454 methods. We performed an electronic Northern search of the no hits in the coffee libraries. Plant material, for qPCR assays, was obtained from different tissues (leaves, roots, fruits and meristems) of the species C. arabica and C. canephora subjected to different biological conditions (biotic and abiotic stresses) and fruits at early, intermediate and late development stages. As a result, in silico analyzes identified and characterized 1.568 orphan genes in accordance with the libraries in which they were expressed. Therefore, we selected and performed qPCR of 17 orphan genes potentially involved in tolerance to biotic and abiotic stresses, as well as, orphan genes involved in coffee fruit development. These genes responded differentially in tissues and with biological conditions, confirming in silico analyzes previously obtained and providing evidences for their probable involvement in specific biological processes in coffee plants.