DSpace Repository

Recomendação de vocabulários para mapeamento de dados conectados

Show simple item record

dc.contributor.advisor Nunes, Bernardo Pereira
dc.contributor.author Amaral, Wagner Gomes do
dc.date.accessioned 2018-03-01T17:14:23Z
dc.date.available 2018-03-01T17:14:23Z
dc.date.issued 2017-07-25
dc.identifier.citation AMARAL, Wagner Gomes do. Recomendação de vocabulários para mapeamento de dados conectados. 2017. 58f. Dissertação (Mestrado em Informática) - Universidade Federal do Estado do Rio de Janeiro, Rio de Janeiro, 2017. pt_BR
dc.identifier.uri http://hdl.handle.net/unirio/11182
dc.description.sponsorship n/a pt_BR
dc.language.iso Portuguese pt_BR
dc.rights openAccess pt_BR
dc.title Recomendação de vocabulários para mapeamento de dados conectados pt_BR
dc.type masterThesis pt_BR
dc.contributor.advisor-co Siqueira, Sean Wolfgand Matsui
dc.contributor.referee Nunes, Bernardo Pereira
dc.contributor.referee Ferreira, Simone Bacellar Leal
dc.contributor.referee Campos, Gilda Helena Bernardino de
dc.contributor.referee Siqueira, Sean Wolfgand Matsui
dc.degree.department CCET pt_BR
dc.degree.grantor Universidade Federal do Estado do Rio de Janeiro - UNIRIO pt_BR
dc.degree.level Mestrado Acadêmico pt_BR
dc.degree.local Rio de Janeiro, RJ. pt_BR
dc.degree.program Programa de Pós-Graduação em Informática pt_BR
dc.subject.cnpq CIÊNCIAS EXATAS E DA TERRA pt_BR
dc.subject.cnpq CIÊNCIA DA COMPUTAÇÃO pt_BR
dc.subject.en Vocabulary recommendation pt_BR
dc.subject.en Linked data pt_BR
dc.subject.en Data publishing pt_BR
dc.subject.en Linked educational data pt_BR
dc.subject.en Semantic Web pt_BR
dc.description.abstracten With the increasing adoption of Linked Data (LD) standards for publishing and connecting structured data on the Web, a global data space has been created covering a large variety of domains (e.g. Education, Government, Life Sciences, Linguistics, etc.) as shown in the LOD cloud. Additionally, LD has also led to the creation of a number of cross-domain and domain-specific applications, allowing the interlinking of heterogeneous applications at the data level. Despite the many benefits of using LD, a number of challenges arises when one wants to publish data following the LD standards. A common problem faced by data publishers is on how to semantically representing data – one of the first steps when publishing linked data. For this task, a data publisher needs to either create his own vocabulary or to reuse one or more of the existing vocabularies published on the Web. The latter takes data publishers to a prior problem, that is, how to find vocabularies that best represent their data? This is the problem addressed in this dissertation. To address these problems, this dissertation introduces RVMDC, a process, an architecture and a tool that can be used for recommending vocabularies to data that will be published as LD in the Web. Evaluation using educational and content management databases shows good results in terms of precision, recall and f-measure as well as its ability on assisting data publishers in the task of dataset publication. pt_BR
dc.degree.country Brasil pt_BR
dc.description.sponsordocumentnumber n/a pt_BR
dc.description.abstractpt Com a crescente adoção de dados conectados (DC) como padrão para publicação e conexão de dados estruturados na Web, cria-se um espaço de dados global que abrange uma grande variedade de domínios (por exemplo, Educação, Governo, Ciências, Linguística etc.), como pode ser visto na nuvem de dados abertos conectados (LOD). Além disso, DC têm fomentado a criação de uma série de aplicações baseadas na interligação de aplicações heterogêneas no nível de dados. Apesar dos muitos benefícios de usar dados conectados, uma série de desafios emerge ao publicá-los seguindo padrões específicos. Um problema comum enfrentado pelos publicadores de dados é como representa-los semanticamente – sendo esta uma das primeiras etapas ao publicar dados conectados. Para esta tarefa, um publicador de dados precisa criar um vocabulário ou reutilizar um ou mais vocabulários existentes e publicados na Web. O último caso leva os publicadores de dados a um problema anterior, ou seja, como encontrar vocabulários que melhor representem seus dados? Este é o problema abordado nesta dissertação. Para resolver os problemas mencionados, esta dissertação apresenta o RVMDC, que consiste de um processo, uma arquitetura e uma ferramenta desenvolvidos para recomendar vocabulários para representar dados que serão publicados como dados conectados na Web. Para avaliar o RVMDC, utilizamos bancos de dados relacionais educacionais e de gerenciamento de conteúdo. Os resultados, em termos de precisão, recall e f-measure, bem como sua capacidade de auxiliar os publicadores de dados na tarefa de publicação de conjunto de dados confirmam o potencial da ferramenta para recomendação de vocabulários. pt_BR
dc.subject.pt Recomendação de Vocabulários pt_BR
dc.subject.pt Dados Conectados pt_BR
dc.subject.pt Publicação de Dados pt_BR
dc.subject.pt Dados educacionais conectados pt_BR
dc.subject.pt Web semântica pt_BR


Files in this item

This item appears in the following Collection(s)

Show simple item record

Search DSpace


Advanced Search

Browse

My Account

|
|