Agenda de defesas Agenda de defesas

Voltar

Programa de Pós-Graduação em Ciência da Computação promove defesa de dissertação

A apresentação será às 13h de amanhã (21), no auditório do Centro de Informática (CIn)

O Programa de Pós-Graduação em Ciência da Computação da UFPE promove a defesa da dissertação “Transferindo Conhecimento de Textos para Imagens Através da Aprendizagem das Características Semânticas”, do mestrando Miguel Domingos de Santana Wanderley. A apresentação será às 13h de amanhã (21), no auditório do Centro de Informática (CIn), no Campus Recife da Universidade. 

O trabalho foi orientado pelo professor Ricardo Bastos Cavalcante Prudêncio, que irá compor a banca da defesa de dissertação com os professores Tsang Ing Ren (UFPE/Centro de Informática) e Filipe Rolim Cordeiro (UFRPE/Departamento de Estatística e Informática). 

Resumo

Redes neurais profundas vêm mostrando um expressivo desempenho em tarefas de reconhecimento de imagens. Dentre as principais técnicas de redes neurais profundas, destacam-se as redes neurais convolucionais, as quais apresentam a capacidade de aprender características de alto nível em imagens, considerando o aspecto espacial das mesmas. A profundidade das redes neurais convolucionais permitem que características de baixo nível sejam combinadas em características de mais alta complexidade, gradativamente, até que imagens possam ser codificadas em características de alto nível. Dentre as atividades de reconhecimento de imagens podemos mencionar a classificação de imagens, detecção de objetos e segmentação de imagens. No entanto, as principais técnicas de redes convolucionais profundas demandam volumes massivos de imagens rotuladas para treinamento, nem sempre disponíveis. Neste contexto, técnicas de transferência de conhecimento vêm sendo adotadas para superar a falta de dados rotulados disponíveis para treinamento de modelos em tarefas específicas. De modo geral, transferência de aprendizagem busca utilizar dados disponíveis em quantidades expressivas em um determinado domínio fonte para possibilitar uma aprendizagem mais eficiente de um modelo em dados de um domínio alvo, geralmente mais escasso. Este trabalho apresenta uma nova arquitetura de rede neural profunda com a capacidade de transferir conhecimento de dados textuais associados a imagens (domínio fonte) para auxiliar na atividade de reconhecimento de imagens (domínio alvo). Como componentes a rede proposta utiliza um extrator convolucional de características visuais latentes de imagens (codificador) como um modelo generativo probabilístico é usado para definir tópicos semânticos textuais. Uma combinação de classificadores é então utilizada para estimar tópicos semânticos para novas instâncias de imagens baseada nas características visuais latentes desta instância. Experimentos foram conduzidos para avaliar o quão relacionadas estão as características latentes em ambos os domínios (textual e visual) e ainda verificar a eficácia dos tópicos semânticos preditos pelo modelo proposto na tarefa de classificação de imagens. Resultados promissores foram verificados comparando-se com diferentes abordagens estado da arte neste cenário multimodal heterogêneo.

Mais informações
(81) 2126.8430

Data da última modificação: 20/08/2018, 13:21