O I Workshop André Balan de Pós-Graduação em Ciência da Computação é destinado a divulgação de pesquisas de alunos do Programa de Pós-Graduação em Ciência da Computação, além de contar com palestrantes externos renomados por suas vastas contribuições para a Ciência da Computação. O Workshop será realizado em memória de André Balan, ex-membro do Programa de Pós-Graduação em Ciência da Computação, lamentavelmente falecido em um trágico acidente de carro ocorrido em janeiro de 2018.
Organizado por David Correa Martins Jr (CMCC-UFABC), João Paulo Gois (CMCC-UFABC), Flavio Eduardo Aoki Horita (CMCC-UFABC), o I Workshop André Balan foi realizado em 7 de dezembro de 2018, na sala A-101-0 do Bloco A, Santo André e contou com as seguintes palestras:
- 13:10 – Obtaining Dynamic Scheduling Policies with Simulation and Machine Learning
- Palestrante: Danilo Carastan Santos (aluno de doutorado)
- Resumo: Dynamic scheduling of tasks in large-scale HPC platforms is normally accomplished using ad-hoc heuristics, based on task characteristics, combined with some backfilling strategy. Defining heuristics that work efficiently in different scenarios is a difficult task, specially when considering the large variety of task types and platform architectures. In this work, we present a methodology based on simulation and machine learning to obtain dynamic scheduling policies. Using simulations and a workload generation model, we can determine the characteristics of tasks that lead to a reduction in the mean slowdown of tasks in an execution queue. Modeling these characteristics using a nonlinear function and applying this function to select the next task to execute in a queue improved the mean task slowdown in synthetic workloads. When applied to real workload traces from highly different machines, these functions still resulted in performance improvements, attesting the generalization capability of the obtained heuristics.
- 13:50 – Classificação de dados desbalanceados utilizando uma nova técnica de pré-processamento baseada em tetraedros de Delaunay
- Palestrante: Alexandre Miguel de Carvalho (aluno de doutorado)
- Resumo: A classificação de dados extremamente não balanceados é um dos grandes desafios da área de Aprendizagem de Máquina ou Machine Learning . Podemos encontrar este tipo de problema em vastas áreas. A seguir, alguns exemplos: nas áreas médicas tais como classificação de mamografia (com e sem câncer), classificação de proteínas, dentre outras aplicações reais. Na área de TI encontramos este problema na classificação de pacotes de intrusão de redes de computadores. Na área de ecommerce, na classificação de operações fraudulentas. Pode-se dizer que um conjunto de dados é extremamente desbalanceado quando uma das classes possuem até 10% do total. Classificadores tradicionais, nestes casos, não apresentam bons resultados. Sendo assim, a comunidade científica vem estudando e propondo soluções para este tipo de problema real e complexo que ocorre em projetos reais. Várias técnicas foram propostas ao longo dos anos. Podemos dividir estas técnicas em três grandes grupos: oversampling, subsampling e algoritmos modificados e/ou específicos. Nosso trabalho apresenta uma nova técnica de oversampling baseada na geração de exemplos artificiais para o balanceamento das classes utilizando geometria computacional tridimensional, mais especificamente tetraedros de Delaunay. Os resultados alcançados até o momento são animadores. Esta nova técnica apresenta melhor desempenho que as técnicas mais utilizadas de oversampling que são: SMOTE, SMOTE SVM, BORDERLINE SMOTE 1 e BORDERLINE SMOTE 2.
- 14:30 – A Genealogia Acadêmica com base para pesquisa em Cientometria
- Palestrante: Luciano Rossi (aluno de doutorado)
- Resumo: A sociedade contemporânea vivência a denominada Era do Conhecimento, onde a produção, o compartilhamento e o acesso à informação nunca foram tão eficientes. Neste contexto, a estruturação do conhecimento científico fornece os meios para organizar o saber formal e permite o estudo da evolução e da disseminação da ciência. A genealogia acadêmica considera as relações de orientação acadêmica, em diferentes níveis, para a avaliação e classificação de grupos e indivíduos atuantes na academia, respectivamente. Nesta palestra apresentaremos os resultados obtidos nos últimos anos pelo grupo de pesquisa em Cientometria da UFABC no que tange a Genealogia Acadêmica. Consideramos a Genealogia Acadêmica como objeto de estudo e desenvolvemos pesquisas em tópicos relacionados a (i) mineração de grafos genealógicos, (ii) desenvolvimento de métricas topológicas, (iii) identificação do fluxo do conhecimento científico e (iv) identificação de padrões em grafos de genealogia.
- 15:10 – Redução do Problema de Carregamento de Paletes ao Problema de Programação Quadrática Binária Irrestrita
- Palestrante: Eduardo Alves de Jesus Anacleto (aluno de doutorado)
- Resumo: Neste trabalho tratamos de dois problemas de otimização combinatória, que pertencem à classe NP-difícil, de grande relevância prática. O primeiro, o Problema de Carregamento de Paletes do Produtor (PCPP), consiste em dispor a maior quantidade possível de retângulos com dimensões (l, c) e (c, l) dentro um retângulo maior com dimensões (L, W), sem que haja sobreposições entre os retângulos menores. O segundo, o Problema de Programação Quadrática Binária Irrestrita (PPQBI), consiste em maximizar a função f(x) = xTQx, onde Q é uma matriz n × n de coeficientes racionais e x é um vetor binário com n componentes. Mostramos como reduzir o PPCP ao PPQBI, em tempo polinomial no tamanho da instância do primeiro problema. Após a redução, percebemos que as matrizes das instâncias do PPQBI apresentam certos padrões, que podem ser explorados para resolver rapidamente estas instâncias. Um fato interessante é que os coeficientes na matriz Q têm somente valores 0, 1 ou -2. Os nossos resultados computacionais preliminares são promissores.
- 16:10 – Meltdown e Spectre
- Palestrante: Siang Wun Song (IME-USP)
- Resumo: Os ataques Meltdown e Spectre, descobertos e divulgados em 2017, conseguem acessar, sem permissão, memória de sistema ou de outros usuários. Meltdown explora vulnerabilidades de processadores Intel x86, produzidos depois de 1995, e alguns modelos de AMD ARM. Meltdown rompe o mecanismo que impede aplicações em acessar memória do sistema, provocando e manipulando exceção. Spectre afeta quase todos os processadores modernos dos últimos 20 anos. Procura enganar aplicações em acessar posições arbitrárias da memória, sem causar nenhuma exceção. Spectre é mais difícil de consertar, e parece que vai assombrar por algum tempo, daí o nome. Neste seminário, vamos explicar e ilustrar de forma didática os mecanismos de ataque Meltdown e Spectre, que exploram os efeitos colaterais produzidos por algumas técnicas utilizadas para aumentar o desempenho dos processadores modernos, como execução fora de ordem, predicção de desvio, execução especulativa e uso da memória cache.
- 17:10 – Palavras Visuais: Como Descrever e Recuperar Imagens por Conteúdo
- Palestrante: Agma Juci Machado Traina (ICMC-USP)
- Resumo: A quantidade e a complexidade dos dados gerados e gerenciados nos sistemas atuais, tais como imagens e vídeos, trazem diversos desafios aos desenvolvedores de sistemas de gerenciamento de dados, a fim de atender à expectativa dos usuários em responder a seus questionamentos e dos proprietários de dados, com relação ao benefício que deles podem obter. As consultas sobre imagens e dados complexos são naturalmente mais efetivas se feitas considerando seus aspectos de similaridade. A recuperação de imagens baseada em conteúdo permite executar consultas por similaridade e análises usando informações extraídas automaticamente dos próprios dados sem intervenção do usuário. Desse modo, são adequadas para o cenário atual de big data. Nesta palestra discutiremos o uso de palavras visuais e uma abordagem de representação semântica para a construção de frases visuais em imagens de diversos domínios. Também apresentaremos alguns exemplos e resultados obtidos com mais de uma década de experiência em aplicações reais na área médica.
- Palestrante: Agma Juci Machado Traina (ICMC-USP)