Events Events

Back

Pós-Graduação em Ciência da Computação realiza defesa de dissertação de mestrado na quinta-feira (2)

Trabalho é de autoria de Karl Vandesman de Matos Sousa, com a orientação do professor Adenilton José da Silva

O Programa de Pós-Graduação em Ciência da Computação da UFPE promove defesa de dissertação de mestrado do aluno Karl Vandesman de Matos Sousa, nesta quinta-feira (2), às 10h. A apresentação acontecerá de forma remota, através da plataforma Google Meet, e os interessados em assistir devem entrar em contato com o aluno através do e-mail kvms@cin.ufpe.br. É recomendado que se entre na sala virtual com o microfone e câmera desligados.
 
Com o título “Desenvolvimento de base de dados e algoritmo de classificação antecipada de exames RT-qPCR para covid-19”, o trabalho contou com a orientação do professor Adenilton José da Silva. A defesa conta com a banca examinadora formada pelos docentes Adenilton José da Silva (UFPE/Centro de Informática), George Gomes Cabral (UFRPE/Departamento de Computação) e André Câmara Alves do Nascimento (UFRPE/Departamento de Computação).
 
Resumo
 
A doença denominada covid-19, causada pelo vírus SARS-CoV-2, foi a responsável por gerar uma pandemia, preocupando diversos órgãos e instituições ao redor do mundo de forma a combatê-la e reduzir o seu impacto. Um dos fatores importantes para esse combate é o diagnóstico da doença, que deve considerar a assertividade e o tempo levado para sua conclusão. Este trabalho atuou nos dados quantitativos gerados pelo exame RT-qPCR, obtidos pela disponibilização feita pelo Núcleo de Pesquisa em Inovação Terapêutica (Nupit) da Universidade Federal de Pernambuco. Os arquivos de saída do exame foram filtrados e ajustados de forma a se ter uma base de dados disponível para treinamento de algoritmos de aprendizagem supervisionada, totalizando 75.716 linhas com 45 características temporais (ciclos de máquina) e um alvo a ser classificado como positivo ou negativo. Esses dados formam uma série temporal, sendo cada característica um valor de fluorescência do processo da reação química do RT-qPCR, de forma a detectar genes do SARS-CoV-2. Foram elencados diferentes algoritmos da literatura, desde mais genéricos para classificação, a outros mais complexos, utilizando comitês, e considerando a ordenação temporal das características do problema. Primeiramente, esses algoritmos foram treinados com a totalidade dos ciclos, para se ter uma referência do desempenho que poderia ser obtido. Posteriormente, foram realizados treinamentos com uma redução desse número de ciclos, com o intuito de antecipar o exame e consequentemente diminuir o tempo necessário para sua conclusão. Para comparar os desempenhos, foram analisadas as métricas AUROC (do inglês, Area Under the Receiver Operating Characteristic), acurácia, especificidade e sensibilidade, com média e desvio padrão calculadas em cima de cem reamostragens da base de dados. Para o cenário de redução de 30 ciclos, foi realizada a otimização de hiperparâmetros dos três algoritmos que se destacaram na etapa anterior: um baseado em redes neurais, MLP (Multilayer Perceptron) e dois comitês de classificadores, o XGBoost e o Time Series Forest (TSF), sendo que este último considera a relação temporal das características. Testes estatísticos realizados indicaram um maior desempenho do TSF (AUROC 98,98 ± 0,07%) e do MLP (98,94 ± 0,19%) para 30 ciclos, uma melhoria de desempenho graças à otimização, mas ainda com desempenho inferior ao algoritmo treinado com 35 ciclos com valores padrões de hiperparâmetros. Com isso, este trabalho fornece respaldo para a redução do tempo do RT-qPCR aplicado para covid-19, por meio de algoritmos de aprendizagem de máquina.
Date of last modification: 31/05/2022, 15:03