• Portal do Governo Brasileiro

Plataforma Sucupira

Dados do Trabalhos de Conclusão

CENTRO FEDERAL DE EDUCAÇÃO TECNOLÓGICA CELSO SUCKOW DA FONSECA
CIÊNCIA DA COMPUTAÇÃO (31022014009P5)
MÉTODOS BASEADOS EM HOMOLOGIA E APRENDIZADO DE MÁQUINA PARA IDENTIFICAÇÃO DE PROTEÍNAS ESSENCIAIS
JESSICA DA SILVA COSTA
DISSERTAÇÃO
13/09/2023

O desenvolvimento de um fármaco costuma ser um processo complexo e demorado. Principalmente na fase inicial, a seleção de um alvo para desenvolvimento de fármacos pode demorar muitos anos. Genes e proteínas essenciais são entidades biológicas responsáveis por processos biológicos de sobrevivência e reprodução dos organismos. Genes e proteínas com relação de ancestralidade, em organismos de espécies diferentes, costumam conservar a função. Além disso, estudos indicam que genes essenciais tendem a ter maior expressão e codificam proteínas que se envolvem em mais interações proteína-proteína. Todas essas características tornam proteínas essenciais potenciais alvos de fármacos. Muitos trabalhos na literatura propõem abordagens biológicas e computacionais para identificação de essencialidade. Diante disso, este trabalho apresenta dois workflows para identificação de características de essencialidade em proteínas para alvos de fármacos do organismo alvo S. mansoni. Para isso, foram abordados um método baseado em homologia e outro método baseado em aprendizado de maquina com os organismos modelo S. cerevisiae, C. elegans e D. melanogaster. O método baseado em homologia identificou 11 proteínas candidatas a essenciais com o grupo de organismos modelo e o organismo S. mansoni. Entre os pares, a maior quantidade de candidatas foi com S. cerevisiae onde foram identificadas 726 proteínas candidatas a essenciais. No método baseado em aprendizado de maquina, cerca de 4000 proteínas foram preditas Para esse método foram realizados experimentos com três algoritmos baseados em árvore, XGBoost e Gradient Boosting e Random Forest, e características baseadas em contexto (interação proteína-proteína) e baseadas em sequencia. Os algoritmos apontaram melhores valores de recall com o uso da técnica de Undersampling. Ainda, 3290 proteínas foram preditas como essenciais pelos três algoritmos trabalhados, o que demonstrou certa semelhança entre os resultados dos algoritmos.

Alvos de Fármacos;Homologia;Aprendizado de Maquina;Redes de Interação Proteína-Proteína;Sequências;Essencialidade
Drug development is often a complex and time-consuming process. Especially in the initial phase, the selection of a target for drug development can take many years. Essential genes and proteins are biological entities responsible for biological processes of survival and reproduction of organisms. Genes and proteins related to ancestry, in organisms of different species, usually retain their function. Furthermore, studies indicate that essential genes tend to have higher expression and encode proteins that engage in more protein-protein. All these characteristics make proteins potential drug targets. Many works in the literature propose biological and computational approaches for essentiality identification. Therefore, this work presents two workflows for identifying essentiality characteristics in proteins for drug targets of the target organism S. mansoni. For this, a method based on homology and another method based on machine learning with Model organisms S. cerevisiae, C. elegans and D. melanogaster. The homology-based method identified 11 essential candidate proteins with the group of model organisms and the organism S. mansoni. Among peers, the largest number of candidates it was with S. cerevisiae where 726 candidate essential proteins were identified. Full name based on machine learning, around 4000 proteins were predicted for this method experiments were carried out with three tree-based algorithms, XGBoost and Gradient Boosting and Random Forest, and context-based features (protection-protection interaction) and sequence-based. The algorithms showed better recall values using the technique of Undersampling. Furthermore, 3290 proteins were predicted as essential by the three algorithms worked on, which demonstrated a certain similarity between the results of the algorithms.
Drug Targets;Homology;Machine Learning;Protein-Protein Interaction Networks;Sequences;Essentiality
1
64
PORTUGUES
CENTRO FEDERAL DE EDUCAÇÃO TECNOLÓGICA CELSO SUCKOW DA FONSECA
O trabalho possui divulgação autorizada
CEFET_RJ_Jéssica_Dissertação_Final.pdf

Contexto

Ciência da Computação
ANÁLISE DE DADOS E APLICAÇÕES
Gerência, Integração e Workflows em Big Data

Banca Examinadora

KELE TEIXEIRA BELLOZE
DOCENTE - PERMANENTE
Sim
Nome Categoria
DIOGO ANTONIO TSCHOEKE Participante Externo
EDUARDO BEZERRA DA SILVA Docente - PERMANENTE
KELE TEIXEIRA BELLOZE Docente - PERMANENTE
VICTOR STROELE DE ANDRADE MENEZES Participante Externo

Vínculo

CLT
Empresa Privada
Empresas
Sim
Plataforma Sucupira
Capes UFRN RNP
  • Compatibilidade
  • . . .
  • Versão do sistema: 3.87.7
  • Copyright 2022 Capes. Todos os direitos reservados.

Nós usamos cookies para melhorar sua experiência de navegação no portal. Ao utilizar o gov.br, você concorda com a política de monitoramento de cookies. Para ter mais informações sobre como isso é feito, acesse Política de cookies.Se você concorda, clique em ACEITO.

Politica de Cookies

O que são cookies?

Cookies são arquivos salvos em seu computador, tablet ou telefone quando você visita um site.Usamos os cookies necessários para fazer o site funcionar da melhor forma possível e sempre aprimorar os nossos serviços. Alguns cookies são classificados como necessários e permitem a funcionalidade central, como segurança, gerenciamento de rede e acessibilidade. Estes cookies podem ser coletados e armazenados assim que você inicia sua navegação ou quando usa algum recurso que os requer.

Cookies Primários

Alguns cookies serão colocados em seu dispositivo diretamente pelo nosso site - são conhecidos como cookies primários. Eles são essenciais para você navegar no site e usar seus recursos.
Temporários
Nós utilizamos cookies de sessão. Eles são temporários e expiram quando você fecha o navegador ou quando a sessão termina.
Finalidade
Estabelecer controle de idioma e segurança ao tempo da sessão.

Cookies de Terceiros

Outros cookies são colocados no seu dispositivo não pelo site que você está visitando, mas por terceiros, como, por exemplo, os sistemas analíticos.
Temporários
Nós utilizamos cookies de sessão. Eles são temporários e expiram quando você fecha o navegador ou quando a sessão termina.
Finalidade
Coletam informações sobre como você usa o site, como as páginas que você visitou e os links em que clicou. Nenhuma dessas informações pode ser usada para identificá-lo. Seu único objetivo é possibilitar análises e melhorar as funções do site.

Você pode desabilitá-los alterando as configurações do seu navegador, mas saiba que isso pode afetar o funcionamento do site.

Chrome

Firefox

Microsoft Edge

Internet Explorer