Agenda de Defesas
- UFPE/
- Pesquisa/Inovação/
- Agenda de Defesas/
- Pós em Ciência da Computação promove defesa de dissertação de mestrado na tarde de amanhã (28)
Agenda de defesas Agenda de defesas
Pós em Ciência da Computação promove defesa de dissertação de mestrado na tarde de amanhã (28)
O trabalho foi desenvolvido por Jefferson Luiz Pessoa Lima
O Programa de Pós-Graduação em Ciência da Computação da UFPE promove defesa de dissertação de mestrado amanhã (29), a partir das 13h. A apresentação acontecerá de forma remota, através da plataforma Google Meet. É recomendado aos interessados em assistir que entrem com o microfone e câmera desligados.
Com título “Adversarial Oversampling: Um Método Para Balanceamento Baseado em Redes Neurais Adversárias”, o trabalho foi desenvolvido pelo pesquisador Jefferson Luiz Pessoa Lima. A banca examinadora será formada pelo orientador Paulo Salgado Neto (UFPE-CIn) e pelos professores Cleber Zanchettin (UFPE-CIn) e Leandro Augusto da Silva (Universidade Presbiteriana Mackenzie/Faculdade de Computação e Informática).
Resumo
O problema de aprendizagem utilizando bases de dados desbalanceadas é algo frequente e afeta negativamente vários algoritmos de aprendizagem supervisionada. Uma série de classificadores podem ficar enviesados quando são treinados nessas condições, especializando-se somente nas classes com maior quantidade de amostras, deixando de lado as classes minoritárias, as quais podem ser mais importantes para o objetivo em questão. Esse problema exige um esforço considerável de investigação e estudo para elaboração de métodos. Como nem sempre é possível, ou viável, a coleta de novas amostras da classe minoritária, os métodos para realização Oversampling têm sido estudados para geração de amostras a partir das existentes. Utilizando as Generative Adversarial Networks (GANs), que compõem o estado da arte para geração de amostras sintéticas realistas, o presente trabalho propôs o método Adversarial Oversampling (AO). O método proposto utiliza as Auxiliary Classifier GANs – AC-GAN como rede adversária, para aprender a distribuição das classes e gerar amostras sintéticas para balancear a base de dados, concentrando-se na classe minoritária. Durante o treinamento do AO, é dado uma maior atenção às amostras consideradas difíceis, utilizando a própria rede adversária para determinar a dificuldade dessas amostras. Com isso, o AO tenta gerar amostras mais significativas, que colaboram para melhorar a região de fronteira do classificador em questão. As amostras sintéticas geradas são filtradas utilizando o próprio Discriminador D, da rede adversária, para que restem apenas amostras com aspectos realistas pertencentes à classe minoritária. Como o presente trabalho lida com imagens, a morfologia das amostras geradas é um bom fator para determinar a qualidade das mesmas. Por isso, o primeiro experimento realizado teve como objetivo observar a morfologia das amostras geradas pelo Oversampling, e mostrou que o AO consegue gerar amostras com um aspecto visual mais fiel às amostras originais, comparado aos métodos tradicionais de Oversampling. No segundo experimento, foi observado o aumento da taxa de acerto da classe minoritária, à medida que são inseridas as amostras geradas pelo AO. Por fim, no terceiro e último experimento, foram realizados comparativos entre os métodos de Oversampling, observando o quão as amostras geradas contribuem para o aumento na taxa de acerto do classificador. Esse experimento foi repetido em seis bases de dados de imagens. Nos resultados médios, o AO foi superior em quatro das seis das bases, em até 4%. A exceção ocorreu nas bases de dados Breast e XRay, nas quais se observou um equilíbrio dos resultados. Com base nos experimentos realizados, pode-se observar que o método proposto pode ser capaz de gerar amostras sintéticas, balanceando a distribuição das classes e contribuindo no processo de aprendizagem do classificador.