Voltar

Ciência da Computação irá promover defesa de tese na próxima quarta-feira (27)

O trabalho será defendido às 8h30 no auditório do Centro de Informática

O Programa de Pós-Graduação em Ciência da Computação (CIn) da UFPE vai realizar, no dia 27 (quarta-feira), a defesa da tese de doutorado “Loss Function Modeling for Deep Neural Networks Applied to Pixel-level Tasks”. O trabalho redigido por Fidel Alejandro Guerrero Peña, orientado pelo professor Tsang Ing Ren e coorientado pelo professor Germano Crispim Vasconcelos, será defendido às 8h30, no auditório do Centro de Informática.

A banca examinadora será composta pela professora Teresa Bernarda Ludermir (UFPE), pelos professores George Darmiton da Cunha Cavalcanti (UFPE), Carlos Alexandre Barros de Mello (UFPE), Francisco Madeiro Bernardino Junior (UPE) e Jorge de Jesus Gomes Leandro (Motorola Mobility LLC).

Resumo

Nos últimos anos, os métodos baseados em Redes Convolucionais Profundas superaram vários desafios no campo de Visão Computacional e Processamento de Imagens. Particularmente, tarefas em nível de pixel, como segmentação, restauração, aprimoramento e recuperação de informação em imagens, mostraram melhorias significativas graças ao avanço das redes neurais profundas. No geral, o treinamento de uma rede neural é o mesmo que resolver um problema de otimização complexo, onde as incógnitas são os parâmetros do modelo, e o objetivo é transformar vetores do domínio de entrada para o conjunto de saída. Esse processo de otimização pode ser visto como uma busca direcionada em uma superfície de erro, em que o conjunto ideal de pesos é aquele que gera erro mínimo em uma amostra de dados. Dado que chegar ao mínimo global é muito difícil, a tarefa é simplificada a encontrar uma solução aceitável para uma tarefa dada. No entanto, devido à alta dimensionalidade do espaço da solução, a não convexidade da superfície de erro, e a presença de muitas planícies, o processo de treinamento de uma rede neural é geralmente tratado por meio do ajuste cuidadoso dos hiperparâmetros do modelo e anotando um amplo conjunto de dados de treinamento. As três componentes principais da função de custo usada no treinamento supervisionado são a arquitetura, os dados, e a função de perda. Apesar do surgimento de novas arquiteturas, encontrar redes melhores é difícil. A modelagem de funções de perda é uma abordagem mais efetiva para melhorar o processo de otimização e, por consequência, achar modelos com melhor performance. Este trabalho propõe usar uma rede dada, e concentra-se na modelagem de funções de perda para problemas de regressão e classificação em nível de pixel, também conhecida como segmentação de imagem, visando melhorar a performance. A lógica por trás das funções de perda propostas é que a incorporação de priors em forma de regularização ajuda a diferenciar modelos com performance semelhante. Novas técnicas de pré-processamento e pós-processamento também são propostas em cada caso para ajudar na solução de problemas reais. A aplicabilidade das funções de perda de classificação em nível de pixel na tarefa de segmentação de instância com supervisão completa e fraca foi estudada usando conjuntos de dados desafiadores de imagem biológica com células isoladas e agrupadas para 2D e 3D. A função de perda de regressão em nível de pixel foi aplicada no problema de fusão de imagem com múltiplos focos. Os resultados da experimentação em tarefas de segmentação de instâncias e restauração de imagens sugerem uma melhoria do desempenho quando comparado com funções de perda semelhantes. Nas propostas de segmentação 3D e fusão de imagens com múltiplos focos, foi observada uma alta eficiência computacional.

Mais informações
Programa de Pós-Graduação em Ciência da Computação (CIn)
(81) 2126.8430/Ramal 4027

 

 

Data da última modificação: 25/11/2019, 15:55