Partilhe nas Redes Sociais

PUB

GMV: Innovating solutions in Cybersecurity

Estudo em machine learning vence prémio de Melhor Tese de Doutoramento

Publicado em 3 Outubro 2017 por Ntech.news | 119 Visualizações

O trabalho do investigador Filipe Rodrigues no Departamento de Engenharia Informática da Faculdade de Ciências e Tecnologia da Universidade de Coimbra (FCTUC) foi considerado a “Melhor Tese de Doutoramento” pela Associação Portuguesa de Reconhecimento de Padrões (APRP).

A tese debruça-se sobre aprendizagem de máquina e recebeu também uma menção honrosa da Associação Portuguesa para a Inteligência Artificial (APPIA). Propõe um conjunto de modelos probabilísticos para aprendizagem a partir de dados gerados pela multidão, que têm alterado a forma como muitos problemas de aprendizagem de máquina são abordados em diferentes áreas do domínio científico. Por exemplo, no processamento de linguagem natural, visão por computador e música.

A tese «Probabilistic Models for Learning from Crowdsourced Data» foi orientada pelos docentes Francisco Câmara Pereira e Bernardete Ribeiro. «Têm-se verificado grandes desenvolvimentos na área de machine learning, permitindo ter, hoje em dia, sistemas inteligentes capazes de reconhecer a nossa voz e responder a perguntas, traduzir textos de forma automática, conduzir veículos de forma autónoma, etc.», explica Bernardete Ribeiro. «Por detrás deste recente progresso estão contribuições ao nível da teoria e novos algoritmos de aprendizagem, bem como a crescente disponibilidade de dados – vulgarmente designados de Big Data», acrescenta esta especialista, sublinhando que o sucesso dos algoritmos de machine learning está «frequentemente dependente da disponibilidade de grandes volumes de exemplos etiquetados».

Por exemplo, se quisermos criar um sistema capaz de distinguir imagens de peões de imagens de automóveis, é necessária a criação de um conjunto de dados etiquetados com milhões de exemplos de imagens de peões e imagens de automóveis. Como é óbvio, não se pode recorrer à etiquetagem manual dos dados, e é aí que entram as plataformas de crowdsourcing, como a Amazon Mechanical Turk (AMT).

O processo obriga ao desenvolvimento de abordagens específicas para minimizar o facto de cada anotador ter diferentes níveis de perícia individual. O que a tese propõe são «modelos probabilísticos capazes de diferenciar, de forma automática e totalmente não-supervisionada, os anotadores confiáveis dos menos confiáveis ou até identificar anotadores cujas respostas são dadas de forma aleatória ou pouco premeditada», esclarece Bernardete Ribeiro.

Na segunda parte da tese, são usados dados gerados pela multidão como entradas adicionais de forma a melhorar modelos de aprendizagem de máquina. É considerado o problema de compreender a procura em sistemas de transportes na presença de eventos, tais como concertos, eventos desportivos ou festivais.

Os modelos propostos tornam possível descobrir várias tendências. Por exemplo, que das 5000 pessoas que viajaram para uma zona da cidade a uma dada hora existem 3000 pessoas acima do expectável em condições normais, e que dessas 3000 pessoas, 2500 dirigiram-se a um concerto e as restantes 500 a uma peça de teatro.

«Tendo em conta o poder disruptivo de certos eventos ou combinações de eventos, é fundamental ter em conta o seu impacto nas previsões da procura de transportes bem como compreender o seu papel na maneira como as pessoas se deslocam em espaços urbanos», conclui a investigadora.

 


Publicado em:

Talento

Partilhe nas Redes Sociais

Artigos Relacionados