dc.contributor.advisor |
Amorim, Fernanda Araujo Baião |
|
dc.contributor.author |
Silva, Mateus Ferreira |
|
dc.date.accessioned |
2018-06-25T20:20:59Z |
|
dc.date.available |
2018-06-25T20:20:59Z |
|
dc.date.issued |
2015-09-24 |
|
dc.identifier.citation |
SILVA, Mateus Ferreira. Learning data-aware declarative models from provenance data. 2015. 62 f. Dissertação (Mestrado em Informática) - Universidade Federal do Estado do Rio de Janeiro, Rio de Janeiro, 2015. |
pt_BR |
dc.identifier.uri |
http://hdl.handle.net/unirio/11793 |
|
dc.description |
Dissertação também disponível em formato impresso, com o número de chamada CCET MI 2015/13. |
pt_BR |
dc.description.sponsorship |
n/a |
pt_BR |
dc.language.iso |
English |
pt_BR |
dc.rights |
openAccess |
pt_BR |
dc.title |
Learning data-aware declarative models from provenance data |
pt_BR |
dc.type |
masterThesis |
pt_BR |
dc.contributor.advisor-co |
Revoredo, Kate Cerqueira |
|
dc.contributor.referee |
Amorim, Fernanda Araujo Baião |
|
dc.contributor.referee |
Revoredo, Kate Cerqueira |
|
dc.contributor.referee |
Santoro, Flávia Maria |
|
dc.contributor.referee |
Oliveira, Daniel Cardoso Moraes de |
|
dc.degree.department |
CCET |
pt_BR |
dc.degree.grantor |
Universidade Federal do Estado do Rio de Janeiro - UNIRIO |
pt_BR |
dc.degree.level |
Mestrado Acadêmico |
pt_BR |
dc.degree.local |
Rio de Janeiro, RJ. |
pt_BR |
dc.degree.program |
Programa de Pós-Graduação em Informática |
pt_BR |
dc.subject.cnpq |
CIÊNCIAS EXATAS E DA TERRA |
pt_BR |
dc.subject.cnpq |
CIÊNCIA DA COMPUTAÇÃO |
pt_BR |
dc.subject.en |
Data-aware |
pt_BR |
dc.subject.en |
Declarative model |
pt_BR |
dc.subject.en |
Provenance data |
pt_BR |
dc.subject.en |
Scientific workflow |
pt_BR |
dc.description.abstracten |
Data provenance represents a collection of metadata on the origin and history of data. In
scientific workflows, this metadata is essential for operational support of scientific
experiments. The amount of provenance data generated from scientific workflow
executions grows exponentially through time, becoming infeasible for scientists to
manually analyze its content. Thus, mechanisms for extracting and modeling the
knowledge implicit in provenance data are demanding. Due to the diversity and
flexibility inherent to scientific experimentation scenarios, declarative models are
potentially adequate for the task. However, they typically do not consider data
attributes, which would enrich its embedded knowledge with relevant information such
as parameter values used in each workflow instance. A classification model may fill this
gap. This work proposes an approach to automatically learn both declarative and a
classification models from provenance data, and combine them into a unique view. This
proposed approach was evaluated on two real scientific experiments scenarios on the
domain of text mining and of Evapotranspiration estimation. |
pt_BR |
dc.degree.country |
Brasil |
pt_BR |
dc.description.sponsordocumentnumber |
n/a |
pt_BR |
dc.description.abstractpt |
A proveniência de dados representa uma coleção de metadados sobre a origem e
histórico dos dados. Em workflows científicos, este metadados é essencial para o apoio
operacional de experimentos científicos. A quantidade de dados de proveniência
gerados a partir de execuções de workflows científicos cresce exponencialmente ao
longo do tempo, tornando-se inviável para os cientistas analisar manualmente o seu
conteúdo. Assim, mecanismos para extrair e modelar o conhecimento implícito nos
dados de proveniência são demandados. Devido à diversidade e flexibilidade inerente
aos cenários de experimentação científica, modelos declarativos são potencialmente
adequados para esta tarefa. Entretanto, eles tipicamente não consideram atributos de
dados, o que poderia enriquecer seu conhecimento incorporado com informações
relevantes, tais como os valores dos parâmetros utilizados em cada instância do
workflow. Um modelo de classificação pode preencher esta lacuna. Este trabalho propõe
uma abordagem para aprender automaticamente tanto modelos declarativos e de
classificação a partir de dados de proveniência, e combiná-los em uma única visão. Esta
abordagem proposta foi avaliada em dois cenários reais experimentos científicos no
domínio de mineração de texto e de estimativa da evapotranspiração. |
pt_BR |
dc.subject.pt |
Data-aware |
pt_BR |
dc.subject.pt |
Modelo declarativo |
pt_BR |
dc.subject.pt |
Dados de proveniência |
pt_BR |
dc.subject.pt |
Workflow científico |
pt_BR |