dc.contributor.advisor |
Nunes, Bernardo Pereira |
|
dc.contributor.author |
Amaral, Wagner Gomes do |
|
dc.date.accessioned |
2018-03-01T17:14:23Z |
|
dc.date.available |
2018-03-01T17:14:23Z |
|
dc.date.issued |
2017-07-25 |
|
dc.identifier.citation |
AMARAL, Wagner Gomes do. Recomendação de vocabulários para mapeamento de dados conectados. 2017. 58f. Dissertação (Mestrado em Informática) - Universidade Federal do Estado do Rio de Janeiro, Rio de Janeiro, 2017. |
pt_BR |
dc.identifier.uri |
http://hdl.handle.net/unirio/11182 |
|
dc.description.sponsorship |
n/a |
pt_BR |
dc.language.iso |
Portuguese |
pt_BR |
dc.rights |
openAccess |
pt_BR |
dc.title |
Recomendação de vocabulários para mapeamento de dados conectados |
pt_BR |
dc.type |
masterThesis |
pt_BR |
dc.contributor.advisor-co |
Siqueira, Sean Wolfgand Matsui |
|
dc.contributor.referee |
Nunes, Bernardo Pereira |
|
dc.contributor.referee |
Ferreira, Simone Bacellar Leal |
|
dc.contributor.referee |
Campos, Gilda Helena Bernardino de |
|
dc.contributor.referee |
Siqueira, Sean Wolfgand Matsui |
|
dc.degree.department |
CCET |
pt_BR |
dc.degree.grantor |
Universidade Federal do Estado do Rio de Janeiro - UNIRIO |
pt_BR |
dc.degree.level |
Mestrado Acadêmico |
pt_BR |
dc.degree.local |
Rio de Janeiro, RJ. |
pt_BR |
dc.degree.program |
Programa de Pós-Graduação em Informática |
pt_BR |
dc.subject.cnpq |
CIÊNCIAS EXATAS E DA TERRA |
pt_BR |
dc.subject.cnpq |
CIÊNCIA DA COMPUTAÇÃO |
pt_BR |
dc.subject.en |
Vocabulary recommendation |
pt_BR |
dc.subject.en |
Linked data |
pt_BR |
dc.subject.en |
Data publishing |
pt_BR |
dc.subject.en |
Linked educational data |
pt_BR |
dc.subject.en |
Semantic Web |
pt_BR |
dc.description.abstracten |
With the increasing adoption of Linked Data (LD) standards for publishing and connecting structured data on the Web, a global data space has been created covering a large variety of domains (e.g. Education, Government, Life Sciences, Linguistics, etc.) as shown in the LOD cloud. Additionally, LD has also led to the creation of a number of cross-domain and domain-specific applications, allowing the interlinking of heterogeneous applications at the data level. Despite the many benefits of using LD, a number of challenges arises when one wants to publish data following the LD standards. A common problem faced by data publishers is on how to semantically representing data – one of the first steps when publishing linked data. For this task, a data publisher needs to either create his own vocabulary or to reuse one or more of the existing vocabularies published on the Web. The latter takes data publishers to a prior problem, that is, how to find vocabularies that best represent their data? This is the problem addressed in this dissertation. To address these problems, this dissertation introduces RVMDC, a process, an architecture and a tool that can be used for recommending vocabularies to data that will be published as LD in the Web. Evaluation using educational and content management databases shows good results in terms of precision, recall and f-measure as well as its ability on assisting data publishers in the task of dataset publication. |
pt_BR |
dc.degree.country |
Brasil |
pt_BR |
dc.description.sponsordocumentnumber |
n/a |
pt_BR |
dc.description.abstractpt |
Com a crescente adoção de dados conectados (DC) como padrão para publicação e conexão de dados estruturados na Web, cria-se um espaço de dados global que abrange uma grande variedade de domínios (por exemplo, Educação, Governo, Ciências, Linguística etc.), como pode ser visto na nuvem de dados abertos conectados (LOD). Além disso, DC têm fomentado a criação de uma série de aplicações baseadas na interligação de aplicações heterogêneas no nível de dados. Apesar dos muitos benefícios de usar dados conectados, uma série de desafios emerge ao publicá-los seguindo padrões específicos. Um problema comum enfrentado pelos publicadores de dados é como representa-los semanticamente – sendo esta uma das primeiras etapas ao publicar dados conectados. Para esta tarefa, um publicador de dados precisa criar um vocabulário ou reutilizar um ou mais vocabulários existentes e publicados na Web. O último caso leva os publicadores de dados a um problema anterior, ou seja, como encontrar vocabulários que melhor representem seus dados? Este é o problema abordado nesta dissertação. Para resolver os problemas mencionados, esta dissertação apresenta o RVMDC, que consiste de um processo, uma arquitetura e uma ferramenta desenvolvidos para recomendar vocabulários para representar dados que serão publicados como dados conectados na Web. Para avaliar o RVMDC, utilizamos bancos de dados relacionais educacionais e de gerenciamento de conteúdo. Os resultados, em termos de precisão, recall e f-measure, bem como sua capacidade de auxiliar os
publicadores de dados na tarefa de publicação de conjunto de dados confirmam o potencial da ferramenta para recomendação de vocabulários. |
pt_BR |
dc.subject.pt |
Recomendação de Vocabulários |
pt_BR |
dc.subject.pt |
Dados Conectados |
pt_BR |
dc.subject.pt |
Publicação de Dados |
pt_BR |
dc.subject.pt |
Dados educacionais conectados |
pt_BR |
dc.subject.pt |
Web semântica |
pt_BR |