Alternative Splicing (AS) is a co-transcriptional mechanism that enables the eukaryote to extend its proteome even with a limited number of genes. The cellular machinery performs AS by combining alternative regions of the isoforms in both productive and non-productive transcripts. AS events can be predicted using RNASeq data. In plants, the most frequent event is the retention of introns (IR) that can have a regulatory effect, for example, inserting a premature stop codon (PTC) that leads to degradation of the transcript through the nonsense-mediated decay (NMD) pathway. To study potential AS events in the biological process of coffee bean and tomato ripening, we conducted a DAS study using RNASeq data obtained for differential expression experiment and the referential coffee genome to identify differential AS (DAS). For this, we developed pipelines in Python to perform an automated curation of the 202 target genes that were identified with 241 DAS events by rMATS in the comparisons of early green fruits, intermediate yellow and final red ripening stage. We then carried out a manual curation of the 241 events enriched with the Interproscan5 annotation with further experimentally validating of Potassium channel AKT1 and Apyrase 7 genes under differential alternative expression during coffee grain ripening using conventional PCR and qPCR. Due to challenges identified during this analysis associated with the relationship of AS events and RNASeq data processing, we built an application of user- friendly APP to predict AS in RNASeq data. The application development is composed of three modules named GeneAPPScript, GeneAPPServer, GeneAPPExplorer. The GeneAPPScript module is a powerful wrapper that enables to perform a complete DAS analysis from obtaining network data to functional annotation of genes under DAS. This module can run on Debian distros, such as the Google Collaboratory (Colab) environment where it was developed. The GeneAPPServer module is a Flask backend that allows you to integrate outputs from different DAS analysis software that generate data in tabular outputs. Using GeneAPPExplorer, the user can generate dozens of graphs to graphically visualize important results implicit in technical tables exported by DAS analysis software. In addition, through the webapp, the researcher has access to tables enriched with functional and structural annotation data and event attributes. GeneAPP will contribute to the analysis of AS in several other works deposited in public databases where only differential expression at the gene level was analyzed, allowing further explanation when exploring the transcriptome at the isoform level.
O Splicing Alternativo (AS) é um mecanismo cotranscricional que habilita o eucarioto estender seu proteoma mesmo com uma quantidade limitada de genes. A maquinaria celular realiza o AS pela combinação de regiões alternativas das isoformas, tanto em transcritos produtivos quanto em não produtivos. Os eventos de AS podem ser preditos com dados de RNASeq. Em plantas o evento mais frequente é o intron retention (IR) que pode ter efeito regulatório, por exemplo, ao inserir um códon de parada prematuro (PTC) que leva a degradação do transcrito pela via nonsense- mediated decay (NMD). Para estudar potenciais eventos de AS no processo biológico de amadurecimento de grãos de café e tomate conduzimos um estudo de diferencial AS (DAS) utilizando dados de RNASeq obtidos para experimento de expressão diferencial e o genoma de referência para identificar DAS. Para isso, nós desenvolvemos pipelines em Python afim de realizar uma curadoria automatizada dos 202 genes alvo que foram identificados pelo rMATS em 241 eventos de DAS nos contrastes de frutos verde com estágio intermediário de amadurecimento (yellow), e, maduro com yellow. Realizamos em seguida uma curadoria manual dos 241 eventos enriquecidos com a anotação do Interproscan5 que levou ao interesse de validar experimentalmente os genes Potassium channel AKT1 e Apyrase 7 com auxílio de PCR e qPCR. Os desafios identificados durante as análises de AS em dados de RNASeq nos induziram a desenvolver um aplicativo de interface amigável para explorar dados de DAS por RNASeq. O aplicativo foi desenvolvido composto de três módulos GeneAPPScript, GeneAPPServer, GeneAPPExplorer. O modulo GeneAPPScript é um wrapper poderoso que permite executar uma análise completa de DAS desde a obtenção dos dados em rede até a anotação funcional dos genes sob DAS. Esse modulo pode ser executado em distros Debian, como no ambiente Google Colaboratory (Colab) onde foi desenvolvido. Já o modulo GeneAPPServer é um backend Flask que permite integrar saídas de diferentes softwares de análise de DAS que geram dados em outputs tabulares. Usando o GeneAPPExplorer o usuário pode gerar dezenas de gráficos para visualizar graficamente importantes resultados implícitos nas tabelas técnicas exportadas pelos softwares de análises de DAS. Além disso pelo webapp o pesquisador tem acesso a tabelas enriquecidas de dados de anotação funcional, estrutural e atributos dos eventos. O GeneAPP tem potencial de contribuir na análise de AS em vários outros trabalhos depositados em bancos de dados públicos onde só foi analisado expressão diferencial no nível de gene, permitindo expandir o entendimento dos mecanismos moleculares e explorar o transcriptoma no nível de isoformas.