Skip to main content

Atividades Realizadas GovLatinAmerica

Esta página reune tanto o planejamento das atividades como também indica as atividade realizadas

Atividades Planejadas

  • Do dia 09/08/2023 a dia 06/09/2023
    • Consolidação do treinamento realizado no primeiro semestre
      • Fundamentos de programação com Python
      • Coleta de dados (webscrapping)
      • Formação de banco de dados
      • Análise e visualização de dados
    • Estruturar a divulgação dos trabalhos realizados
  • A partir do dia 07/09/2023
    • Métodos e técnicas de pesquisa para análise de dados

Atividades Realizadas

DataAtividades RealizadasParticipantes
14/12/2022Ajustes e padronização da coleta do Ministério da InfraestruturaCíntia, Rafael
13/12/2022Finalização da extração do Ministério da Economia e ajustes e padronização da coleta do Ministério da InfraestruturaCíntia, Rafael
10/11/2022Ajustes e padronização da coleta do Ministério da EconomiaCíntia, Rafael
08/11/2022Ajustes e padronização da coleta do Ministério da EconomiaCíntia, Rafael
07/11/2022Ajustes e padronização da coleta do Ministério da EconomiaCíntia, Rafael
19/10/2022Atualização da função boletins no Ministério da EconomiaCíntia, Rafael
17/10/2022Atualização e padronização das extrações dos Ministério da Defesa, Ministério do Desenvolvimento Regional e Ministério da EconomiaCíntia, Rafael
14/10/2022Atualização completa e padronização das extrações do Ministério das Comunicações e finalização parcial do Ministério da DefesaCíntia, Rafael
11/10/2022Finalização parcial das extrações do Ministério da CiênciaCíntia, Rafael
10/10/2022Continuação da atualização e padronização das extrações do Ministério da Ciência (função boletins)Cíntia, Rafael
07/10/2022Continuação da atualização e padronização das extrações do Ministério da CiênciaCíntia, Rafael
06/10/2022Continuação da atualização e padronização das extrações do Ministério da CiênciaCíntia, Rafael
05/10/2022Atualização e padronização das extrações do Ministério da CiênciaCíntia, Rafael
04/10/2022Atualização e padronização completa das extrações do Ministério do Meio Ambiente e início da atualização e padronização no Ministério da CiênciaCíntia, Rafael
03/10/2022Final da atualização e padronização das extrações do Ministério da AgriculturaCíntia, Rafael
30/09/2022Início da atualização e padronização das extrações do Ministério da AgriculturaCíntia, Rafael
29/09/2022Atualização e padronização (10/10 funções) das extrações da Casa CivilCíntia, Rafael
28/09/2022Atualização e padronização (9/10 funções) das extrações da Casa CivilCíntia, Rafael
27/09/2022Atualização e padronização (7/10 funções) das extrações da Casa CivilCíntia, Rafael
22/09/2022Início da conferência (5/10 funções) das extrações da Casa CivilCíntia, Rafael
21/09/2022Ajustes finais na extração de notícias de todos os ministériosCíntia, Rafael
20/09/2022Ajustes na extração da tag autoria no Ministério da InfraestruturaCíntia, Rafael
16/09/2022Ajustes e adição de extrações da tag autoria no Ministério da InfraestruturaCíntia, Rafael
14/09/2022Ajustes e adição de extrações da tag autoria na Casa Civil e no Ministério da InfraestruturaCíntia, Rafael
12/09/2022Ajustes e adição de extrações da tag autoria no MME, conferência do ministério da Economia e Casa CivilCíntia, Rafael
09/09/2022Conferência dos ministérios da mulher e de minas e energia - erros anotados no documento noticias.mdCíntia, Rafael
08/09/2022Conferência e padronização dos ministérios do arquivo coleta_noticiasCíntia, Rafael
31/08/2022Padronização e adição de novas formas de extração de autoria nos ministérios do arquivo coleta_noticiasCíntia, Rafael
30/08/2022Padronização da extração e tratamento das notícias em diferentes ministériosCíntia, Rafael
29/08/2022Padronização da extração e tratamento das notícias em diferentes ministériosCíntia, Rafael
25/08/2022Padronização da extração e tratamento das notícias em diferentes ministériosCíntia, Rafael
17/08/2022Padronização da extração de notícias dos ministérios da defesa, da economia, da infraestrutura e das minas e energiaRafael, Cíntia
16/08/2022Padronização das notícias no Ministério do Meio Ambiente e no Ministério da DefesaRafael, Cíntia
15/08/2022Atualização das tags e organização da função noticias da Casa Civil e inicio da padronização da função noticia do Ministério do Meio AmbienteRafael, Cíntia
31/05/2022Restruturação das informações e documentação do projetoTreyce, Rafael
19/05/2022MRE - Coleta completa das notas de imprensaTreyce, Rafael
11/05/2022MRE - Início da coleta total das notas de imprensaRafael, Treyce
06/04/2022Início da extração de todas as notas de imprensa dinsponíveis atualmente no site do MRERafael, Treyce
05/04/2022Início da extração dos parágrafos às notas de imprensa atuaisTreyce, Rafael
25/03/2022Inserir título, data, hora, n° da edição das notas no banco jsonTreyce, Rafael
24/03/2022Continuação da estruturação da coleta das notas de imprensa atuaisTreyce, Rafael
23/03/2022Estruturando a coleta das notas de imprensa atuaisTreyce, Rafael
03/03/2022Agendas ministérios - Seperação dos ministérios em blocos para efetuar a coleta mais rapidamenteJoão Motta, Rafael
23/02/2022MRE - Início da coleta das notas de imprensa atuaisTreyce, Rafael
23/02/2022MRE - Ajustes nas entradas do template html e início da inserção dos anos de 1997 a 2021 no banco jsonTreyce, Rafael
22/02/2022MRE - Início da inserção dos dados no banco jsonTreyce, Rafael
17/02/2022Planalto - Substituição das bibliotecas para coleta de PDFJoão Motta, Rafael
15/02/2022MRE - Início da inserção das notas de imprensa no banco de dadosTreyce, Rafael
14/02/2022MRE- Tratamento das notas de imprensa de 2002 a 1997Treyce, Rafael
11/02/2022MRE - Tratamento das notas de imprensa de 2012 a 2003Treyce, Rafael
10/02/2022Ministérios - Finalização da estrutura da coleta das agendasJoão Motta, Rafael
10/02/2022MRE - Tratamento dos erros das notas de impresa 2009 e 2008; resolução do problema para desconsiderar erros vaziosTreyce, Rafael
07/02/2022MRE - Tratamento de erros das notas de imprensa de 2009Treyce, Rafael
04/02/2022MRE - Tratamento notas de imprensa 2010 e 2009Treyce, Rafael
28/01/2022Ministérios - Avanços e reformulaçao da coleta das agendasJoão Motta, Rafael
27/01/2022MRE - tratamento das notas de imprensa de 2011 e 2012Treyce, Rafael
09/12/2021Integração dos arquivos JSON ao template HTMLCintia, João, Rafael
28/10/2021Casa Civil/Planalto/MRE - Estruturação da coleta e do template htmlCintia, João, Rafael
07/10/2021Casa Civil - Mapeamento e início da coleta
07/10/2021Site Planalto - Início da inserção dos dados no Banco
30/09/2021Site Planalto - Início da coleta dos discursos presentes no site
23/09/2021Site Planalto - Continuidade da integração dos sitemaps (lidando com os updates das notícias)
15/09/2021Site Planalto - Integração dos sitemaps gov.br/sitemap.xml, gov.br/planalto.xml
09/09/2021Site Planalto - Preperação para update de novas notícias
02/09/2021Site Planalto - Extração do parágrafo das notícias
26/08/2021Site Planalto - Implementação do tinydb para montar a base de dados
19/08/2021Site Planalto - Coleta do sitemap e extração local dos dados disponíveis no sitemap.xml
12/08/2021Site Planalto - Término do mapeamento e início da coleta no site do Planalto
05/08/2021Site Planalto - Estruturação do mapeamento e início da estruturação do fluxograma da coleta e tratamento dos dados.
29/07/2021Site Planalto - Ajustes BeautifulSoup e extração das informações do xml do sidemap
22/07/2021Site Planalto - Configuração do ambiente virtual Conda e do VSCode

Próximas atividades

  • Rever Readme do repositório
  • Rever estrutura da página aberta do projeto
  • Inserir informações coletadas em banco json