Skip to main content

Projetos

Conheça e contribua com os projetos do LabRI/UNESP

APRESENTAÇÃO

Abaixo estarão expostos os projetos nos quais o LabRI participa, assim como informações essenciais sobre esses projetos. Para acessar a lista simplificada dos projetos de dados clique aqui.

Os projetos do LabRI são divididos conforme seus objetivos. são eles:

Hemeroteca de Política Externa Brasileira

Hemeroteca de Política Externa Brasileira

A Hemeroteca de Política Externa Brasileira contém uma seleção de matérias publicadas, no período de 1972 a 2010, por alguns jornais brasileiros dentre os quais se destacam: O Estado de S. Paulo, Folha de S. Paulo e Gazeta Mercantil. O objetivo desta Hemeroteca é permitir aos pesquisadores interessados o acesso a notícias que foram selecionadas e classificadas ao longo dos anos, de 1972 até 2010, sobre importantes acontecimentos atinentes às relações internacionais do Brasil.

Saiba Mais
NewsCloud

NewsCloud

O projeto NewsCloud considera as notícias vinculadas pelos jornais impressos como uma importante fonte para pesquisas acadêmicas. Nesses veículos de comunicação, além de informações nacionais e internacionais relevantes, são encontrados opiniões de importantes atores políticos. Porém, o conjunto de informações de cada jornal se encontram em bases de dados distintas sem um mecanismo que viabilize uma busca agregada; a indexação integral dos dados vinculados apresenta limitações que dificultam a pesquisa avançada (utilização de operadores booleanos) através da busca por palavras-chaves, especialmente, quando selecionamos um período temporal longo e abarcamos o grande volume de informação; as informações veiculadas em formato textual não estão estruturadas, isso dificulta o cruzamento de metadados importantes (título, autor, caderno, entre outros). Devido a isso, o objetivo geral do Projeto NewsCloud é coletar, indexar, tratar e estruturar as informações veiculadas por jornais impressos. Mais especificamente, este projeto visa (1) coletar integralmente os jornais impressos selecionados, realizando o devido tratamento das informações veiculadas para uma melhor utilização dos dados para pesquisas acadêmicas; (2) subsidiar pesquisas acadêmicas que utilizam jornais impressos como fontes de informação ou objeto de estudo; (3) fornecer um instrumento básico para análise das informações veiculadas; (4) indicar possibilidades e instrumentos que auxiliem análises mais detalhadas das informações veiculadas.

Saiba Mais
DiáriosBR

DiáriosBR

O projeto DiáriosBR reúne a movimentação legal dos governos federal, estadual e municipal que são publicadas nos Diários Oficiais, sendo esse fator o que os tornam uma fonte de pesquisa importante para o acompanhamento da destinação de recursos, transferência de cargos e o embasamento legal das atividades da administração pública. Os Diários são uma importante fonte tanto para pesquisas acadêmicas como também para uma melhor participação social no cotidiano da administração pública. Apesar destes dados serem públicos muitas vezes são disponibilizados em formatos, como PDF, que dificultam uma análise de dados mais aprofundada e rápida sendo necessário um grande tempo despendido para o tratamento destes dados para viabilizar uma análise mais acurada.

Saiba Mais
Full Text

Full Text

O projeto Full Text visa auxiliar o tratamento de dados, convertendo e/ou extraindo tais dados para formato textual passível de indexação e/ou melhor estruturação.Em geral, grande parte dos dados disponibilizados publicamente na internet estão em formatos que dificultam uma rápida e adequada utilização. As boas práticas indicadas nas discussões em torno de dados abertos acabam não sendo seguidas. Com isso, é comum vermos dados sendo disponibilizados no formato de imagem, de pdf ou audiovisual sem transcrição textual. A realização de pós-processamento e/ou OCR em textos disponibilizados no formato de imagem, a conversão de áudios e vídeos para o formato textual e a extração de conteúdos disponibilizados em pdfs estão entre as atividades realizadas nesse projeto.

Saiba Mais
Mercodocs

Mercodocs

O projeto MercoDocs objetiva auxiliar na coleta, tratamento e melhor disponibilização da documentação pública do Mercosul, que possui uma gama extensa e variada de documentação oficial e pública. Apesar disso, encontramos vários problemas que dificultam a adequada utilização deste material. Dentre destes problemas, podemos destacar: a plataforma que disponibiliza os documentos não indexada integralmente os arquivos; alguns metadados que apresentam inconsistência; muitos documentos estão em formato de imagem (tiff) ou em pdf não pesquisável, sendo necessário a realização de OCR para uma melhor utilização dos arquivos neste estado.

Saiba Mais
TweePInA

TweePInA

O objetivo geral do projeto TweePInA é reunir tweets de autoridades e instituições públicas com especial destaque ao Brasil e organismos internacionais. O Twitter é uma das principais redes sociais da atualidade, sendo muito utilizado por autoridades e instituições públicas que são objetos de estudo de várias pesquisas acadêmicas. Porém, ter acesso a série histórica de tweets dessas autoridades e instituições muitas vezes é difícil. Além disso, muitos tweets acabam sendo deletados, não estando disponíveis em arquivos e/ou repositórios públicos. Mais especificamente, este projeto visa (1) auxiliar a construção de uma memória de informações de autoridades e instituições públicas divulgadas através do Twitter; (2) subsidiar pesquisas acadêmicas que utilizam o Twitter como fonte de informação de seus objetos de estudo através da disponibilização das variáveis disponibilizadas pelo Twitter; (3) fornecer um instrumento básico de análise de tweets; (4) indicar possibilidades e instrumentos que auxiliem uma análise mais detalhada dos tweets

Saiba Mais
Acervo Redalint

Acervo Redalint

O projeto Acervo REDALINT surgiu com o objetivo de reunir em uma plataforma a produção científica fornecendo metadados consistentes e a indexação integral do conteúdo disponível. A produção científica de acesso aberto sobre a internacionalização da educação superior na América Latina se encontra dispersa em variados portais, há certa inconsistência nos metadados destas publicações e a indexação integral deste material é rara.

Saiba Mais
IRjournalsBR

IRjournalsBR

O projeto IRjournalsBR objetiva formar uma base de dados que aglutine tanto metadados mais consistentes como também forneça uma indexação integral de revistas. As revistas acadêmicas brasileiras de Relações Internacionais seguem as políticas de acesso aberto. Com isso, todo o conhecimento divulgado por estas revistas podem ser acessados gratuitamente por qualquer pessoa interessada e podem ser reutilizados sem prévia autorização dos editores e autores, desde que seja respeitada a licença de uso do Creative Commons adotado pelos respectivos periódicos. Apesar da adoção do acesso aberto ser um aspecto importante para garantir acesso universal ao conhecimento científico, parte dos metadados destas revistas apresentam inconsistências. Ademais, a indexação integral do conteúdo dessas revistas não é disponibilizada publicamente, dificultando a busca por palavras chaves na integralidade dos arquivos.

Saiba Mais
GovLatinAmerica

GovLatinAmerica

O objetivo do projeto GovLatinAmerica é coletar dados para que possam ser utilizados em pesquisas acadêmicas diversas. Os dados públicos dos órgãos governamentais latino americanos disponíveis via web com frequência são retirados dos sites oficiais, especialmente, após a passagem de um mandato presidencial para outro.

Saiba Mais
Internet e Relações Internacionais

Internet e Relações Internacionais

O projeto Internet e Relações Internacionais visa reunir trabalhos acadêmicos sobre a temática Tecnologias Digitais nas Relações Internacionais.

Saiba Mais