DSpace Repository

Learning data-aware declarative models from provenance data

Show simple item record

dc.contributor.advisor Amorim, Fernanda Araujo Baião
dc.contributor.author Silva, Mateus Ferreira
dc.date.accessioned 2018-06-25T20:20:59Z
dc.date.available 2018-06-25T20:20:59Z
dc.date.issued 2015-09-24
dc.identifier.citation SILVA, Mateus Ferreira. Learning data-aware declarative models from provenance data. 2015. 62 f. Dissertação (Mestrado em Informática) - Universidade Federal do Estado do Rio de Janeiro, Rio de Janeiro, 2015. pt_BR
dc.identifier.uri http://hdl.handle.net/unirio/11793
dc.description Dissertação também disponível em formato impresso, com o número de chamada CCET MI 2015/13. pt_BR
dc.description.sponsorship n/a pt_BR
dc.language.iso English pt_BR
dc.rights openAccess pt_BR
dc.title Learning data-aware declarative models from provenance data pt_BR
dc.type masterThesis pt_BR
dc.contributor.advisor-co Revoredo, Kate Cerqueira
dc.contributor.referee Amorim, Fernanda Araujo Baião
dc.contributor.referee Revoredo, Kate Cerqueira
dc.contributor.referee Santoro, Flávia Maria
dc.contributor.referee Oliveira, Daniel Cardoso Moraes de
dc.degree.department CCET pt_BR
dc.degree.grantor Universidade Federal do Estado do Rio de Janeiro - UNIRIO pt_BR
dc.degree.level Mestrado Acadêmico pt_BR
dc.degree.local Rio de Janeiro, RJ. pt_BR
dc.degree.program Programa de Pós-Graduação em Informática pt_BR
dc.subject.cnpq CIÊNCIAS EXATAS E DA TERRA pt_BR
dc.subject.cnpq CIÊNCIA DA COMPUTAÇÃO pt_BR
dc.subject.en Data-aware pt_BR
dc.subject.en Declarative model pt_BR
dc.subject.en Provenance data pt_BR
dc.subject.en Scientific workflow pt_BR
dc.description.abstracten Data provenance represents a collection of metadata on the origin and history of data. In scientific workflows, this metadata is essential for operational support of scientific experiments. The amount of provenance data generated from scientific workflow executions grows exponentially through time, becoming infeasible for scientists to manually analyze its content. Thus, mechanisms for extracting and modeling the knowledge implicit in provenance data are demanding. Due to the diversity and flexibility inherent to scientific experimentation scenarios, declarative models are potentially adequate for the task. However, they typically do not consider data attributes, which would enrich its embedded knowledge with relevant information such as parameter values used in each workflow instance. A classification model may fill this gap. This work proposes an approach to automatically learn both declarative and a classification models from provenance data, and combine them into a unique view. This proposed approach was evaluated on two real scientific experiments scenarios on the domain of text mining and of Evapotranspiration estimation. pt_BR
dc.degree.country Brasil pt_BR
dc.description.sponsordocumentnumber n/a pt_BR
dc.description.abstractpt A proveniência de dados representa uma coleção de metadados sobre a origem e histórico dos dados. Em workflows científicos, este metadados é essencial para o apoio operacional de experimentos científicos. A quantidade de dados de proveniência gerados a partir de execuções de workflows científicos cresce exponencialmente ao longo do tempo, tornando-se inviável para os cientistas analisar manualmente o seu conteúdo. Assim, mecanismos para extrair e modelar o conhecimento implícito nos dados de proveniência são demandados. Devido à diversidade e flexibilidade inerente aos cenários de experimentação científica, modelos declarativos são potencialmente adequados para esta tarefa. Entretanto, eles tipicamente não consideram atributos de dados, o que poderia enriquecer seu conhecimento incorporado com informações relevantes, tais como os valores dos parâmetros utilizados em cada instância do workflow. Um modelo de classificação pode preencher esta lacuna. Este trabalho propõe uma abordagem para aprender automaticamente tanto modelos declarativos e de classificação a partir de dados de proveniência, e combiná-los em uma única visão. Esta abordagem proposta foi avaliada em dois cenários reais experimentos científicos no domínio de mineração de texto e de estimativa da evapotranspiração. pt_BR
dc.subject.pt Data-aware pt_BR
dc.subject.pt Modelo declarativo pt_BR
dc.subject.pt Dados de proveniência pt_BR
dc.subject.pt Workflow científico pt_BR


Files in this item

This item appears in the following Collection(s)

Show simple item record

Search DSpace


Advanced Search

Browse

My Account

|
|