dc.contributor.advisor |
Revoredo, kate Cerqueira |
|
dc.contributor.author |
Leão, Felipe Braga Carneiro |
|
dc.date.accessioned |
2018-07-11T20:21:28Z |
|
dc.date.available |
2018-07-11T20:21:28Z |
|
dc.date.issued |
2014-09-26 |
|
dc.identifier.citation |
LEÃO, Felipe Braga Carneiro. Expanding the semantic knowledge of wordnet through semantic types and UFO. 2014. xvi, 119 f. Dissertação (Mestrado em Informática) - Universidade Federal do Estado do Rio de Janeiro (2003-), Rio de Janeiro, 2014. |
pt_BR |
dc.identifier.uri |
http://hdl.handle.net/unirio/11929 |
|
dc.description |
Dissertação também disponível em formato impresso, com o número de chamada CCET MI 2014/07. |
pt_BR |
dc.description.sponsorship |
Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES |
pt_BR |
dc.language.iso |
English |
pt_BR |
dc.rights |
openAccess |
pt_BR |
dc.title |
Expanding the semantic knowledge of wordnet through semantic types and ufo |
pt_BR |
dc.type |
masterThesis |
pt_BR |
dc.contributor.advisor-co |
Amorim, Fernanda Araujo Baião |
|
dc.contributor.referee |
Revoredo, Kate Cerqueira |
|
dc.contributor.referee |
Amorim, Fernanda Araujo Baião |
|
dc.contributor.referee |
Siqueira, Sean Wolfgand Matsui |
|
dc.contributor.referee |
Silva, João Carlos Pereira da |
|
dc.degree.department |
CCET |
pt_BR |
dc.degree.grantor |
Universidade Federal do Estado do Rio de Janeiro - UNIRIO |
pt_BR |
dc.degree.level |
Mestrado Acadêmico |
pt_BR |
dc.degree.local |
Rio de Janeiro, RJ. |
pt_BR |
dc.degree.program |
Programa de Pós-Graduação em Informática |
pt_BR |
dc.subject.cnpq |
CIÊNCIAS EXATAS E DA TERRA |
pt_BR |
dc.subject.cnpq |
CIÊNCIA DA COMPUTAÇÃO |
pt_BR |
dc.subject.en |
WordNet |
pt_BR |
dc.subject.en |
Unified Foundational Ontology |
pt_BR |
dc.subject.en |
Semantic Types |
pt_BR |
dc.subject.en |
Natural Lnguage Processing |
pt_BR |
dc.description.abstracten |
Computational linguistics is a field of study concerned with the computational aspects of the human language faculty. It has been largely embraced by researchers of many different areas such as Natural Language Processing, Information Retrieval and Machine Learning, comprising applications like sentence understanding, machine translation, ontology learning, word sense disambiguation, and automatic question answering. WordNet is a large lexical database that exposes different types of semantic relations between words regarding their meanings, being used by an uncountable number of applications for computational linguistics. Nonetheless, its ability of expressing semantic knowledge about synsets (its basic knowledge unit) is still too limited. Previous proposals have attempted to add semantic knowledge to the lexical database, but only approaching common properties, which are more limited in scope than philosophical meta-properties. Relating WordNet synsets to this valuable kind of knowledge would enable algorithms using it as knowledge base to enhance their output, generating results with more accuracy, better mappings and more expressive models overall. This research proposes the expansion of WordNet’s semantic knowledge by defining mapping rules between its synsets and UFO, a foundational ontology capable of exposing philosophical meta-properties of concepts. The proposed mapping rules rely on the use of a linguistic set of categories called Semantic Types. Once mapping rules from synsets to Semantic types have been established, a previous mapping of semantic types to UFO can be applied, achieving a more expressive WordNet. The proposal has been validated through an experiment where specialists manually evaluated over 5.500 sample mappings of WordNet synsets to semantic types, demonstrating the high accuracy level of the established rules. |
pt_BR |
dc.degree.country |
Brasil |
pt_BR |
dc.description.sponsordocumentnumber |
n/a |
pt_BR |
dc.description.abstractpt |
Linguística computacional é um campo de estudo com foco na análise dos aspectos computacionais da linguagem humana. Tem sido amplamente adotado por pesquisadores de diversas áreas, como Processamento de Linguagem Natural, Recuperação de Informação e Aprendizado de Máquina, compreendendo aplicações como compreensão de orações, tradução automática, aprendizado de ontologias, desambiguação de sentido de palavras e resposta automática de questões. WordNet é uma grande base de dados léxica capaz de expor diferentes tipos de relacionamentos semânticos entre palavras com relação aos seus significados, sendo utilizada por uma quantidade incontável de aplicações para a área de linguística computacional. Entretanto, sua habilidade de expressar conhecimento semântico sobre synsets (sua unidade básica de conhecimento) é ainda muito limitada. Propostas anteriores buscaram adicionar conhecimento semântico à base léxica, porém somente no que tange a propriedades comuns, mais limitadas em escopo do que meta-propriedades filosóficas. Relacionar os synsets da WordNet a este tipo valioso de conhecimento permitiria que algoritmos utilizando-a como base de conhecimento melhorassem suas saídas de informação, gerando resultados com maior acurácia, melhores mapeamentos e modelos mais expressivos como um todo. Esta pesquisa propõe a expansão do conhecimento semântico atualmente expresso pela WordNet, definindo regras de mapeamentos entre synsets e a UFO, uma ontologia de fundamentação capaz de expressar meta-propriedades filosóficas sobre conceitos. As regras de mapeamento propostas contam com um conjunto de categorias linguísticas chamado Tipos Semânticos. Uma vez que regras de mapeamentos de synsets para tipos semânticos tenham sido estabelecidas, um mapeamento prévio de tipos semânticos para a UFO pode ser aplicado, alcançando-se uma WordNet mais expressiva. A proposta foi validada através de um experimento aonde especialistas avaliaram manualmente mais de 5.500 amostras de mapeamento de synsets da WordNet para tipos semânticos, demonstrando o alto nível de acurácia das regras criadas. |
pt_BR |
dc.subject.pt |
WordNet |
pt_BR |
dc.subject.pt |
Unified Foundational Ontology |
pt_BR |
dc.subject.pt |
Tipos Semânticos |
pt_BR |
dc.subject.pt |
Processamento de Linguagem Natural |
pt_BR |