Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Detalhes técnicos do Crawler #58

Open
pyanderson opened this issue Feb 17, 2017 · 3 comments
Open

Detalhes técnicos do Crawler #58

pyanderson opened this issue Feb 17, 2017 · 3 comments

Comments

@pyanderson
Copy link

Essa issue tem o intuito de iniciar a discussão sobre os detalhes técnicos da implementação do crawler, como tecnologias e técnicas de extração de dados.

@osanyin
Copy link
Member

osanyin commented Feb 19, 2017

Os dados a respeito da cota parlamentar podem ser encontrados nestes links:

A documentação sobre o formato dos arquivos pode ser encontrada neste link:

A câmara também disponibiliza uma API a parte para consumir os dados referente a deputados, orgãos, proposições, sessões/reuniões e comissões:

@renatosousafilho
Copy link
Member

Pessoal, hoje estava dando uma olhada neste trecho de código (https://github.com/teresinahc/peba/blob/master/lib/camara/camara_parser.rb#L7-L16) e pensei numa possível refatorção,

O parser está fazendo o processo de serialização dos dados em xml para hash de uma forma muito manual. Pensei na possibilidade de otimizarmos isso usando o método String#constantize.

O único detalhe é que nesse padrão o campo ideCadastro ficaria ide_cadastro e não id_cadastro como gostariámos.

@osanyin
Copy link
Member

osanyin commented May 29, 2017

Fala brother, você chegou a olhar as issues #60 e #59?

Antes de tudo, acho importante definirmos uma padronização de nomes e banco. E não acho que deveríamos fugir de um mapeamento manual, pois precisaríamos dele para manter o padrão sugerido nas duas issues.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

3 participants