[okfn-br] [thackday] Re: Dados da execução orçamentária por subprefeitura de São Paulo

Ana Waksberg Guerrini ana.guerrini em gmail.com
Segunda Setembro 15 18:42:18 UTC 2014


reencaminhando o email que o Pedro Marin, Coordenador de Planejamento da
Secr. de Planejamento, enviou a mim e ao Tom:

"Oi Tom, tudo bom?

A Ana me falou q vcs estão tentando obter os dados da execução orçamentária
por sub prefeitura.

Vc já viu o arquivo de base de dados da execução orçamentária no site da
sempla? Lá esses dados aparecem em formato aberto (OK, tecnicamente não é
aberto pq estão em um xls, mas é melhor que os pdfs).
http://sempla.prefeitura.sp.gov.br/orc_homenew.php

Filtrando esses dados por "órgão" vcs conseguem ver a execução de cada sub.

Se puder te ajudar em alguma coisa, avise.

Abs,

Pedro"

Em 10 de setembro de 2014 15:06, Edgar Zanella Alvarenga <e em vaz.io>
escreveu:

> Tabula é pra OCR, estes PDFs não são digitalizados. Usando o pdftotext com
> parâmetro -layout você possui um arquivo txt que pode ser trivialmente
> convertido para csv. Não precisa do Tabula e mesmo que precisasse, melhor
> usá-lo localmente.
>
> 2014-09-10 14:47 GMT-03:00 Everton Zanella Alvarenga <tom em okfn.org.br>:
>
>> Pessoal,
>>
>> durante a última audiência pública do planejamento do orçamento de São
>> Paulo São Paulo para 2015 (notas <
>> https://pad.okfn.org/p/gastosabertos-ploa2015> do encontro na sub da
>> Sé), comecei a vasculhar os dados da execução orçamentária para cada
>> subprefeitura. Está tudo sem muito padrão nos PDFs de cada mês, quando
>> estão completo.
>>
>> Vou tentar começar um script que extraia os PDFs das páginas de cada sub
>> e depois começar a tentar transformar esses dados num CSV. Exemplo da sub
>> da Sé
>>
>>
>> http://www.prefeitura.sp.gov.br/cidade/secretarias/subprefeituras/se/execucao_orcamentaria/index.php?p=27287
>>
>> Alguém que programa de verdade vê algo melhor que usar Beautiful Soup em
>> Python para extrair os PDFs da página de cada sub? Quando eu começar o
>> script (provavelmente começarei a ver isso sexta pela manhã), compartilho o
>> link quando estiver minimamente funcional. Se alguém já tiver um script
>> nessa linha, por favor, compartilhe o link do repositório. :)
>>
>> Temos um Tabula rodando em algum servidor? Caso não, acho que vai ser
>> útil para começarmos a abrir esses dados. Podemos ver algum VPS da OKBR
>> para por um, se não tiver nenhum estável rodando.
>>
>> E podemos pedir para o pessoal da Sempla para publicarem esses dados num
>> formato aberto, eles motraram interesse em colaborar no último encontro de
>> segunda. ;)
>>
>> Valeu!
>>
>> Tom
>>
>> --
>> Everton Zanella Alvarenga (also Tom)
>> Open Knowledge Brasil - Rede pelo Conhecimento Livre
>> http://br.okfn.org
>>
>> _______________________________________________
>> okfn-br mailing list
>> okfn-br em lists.okfn.org
>> https://lists.okfn.org/mailman/listinfo/okfn-br
>> Unsubscribe: https://lists.okfn.org/mailman/options/okfn-br
>>
>>
>  --
> Você recebeu essa mensagem porque está inscrito no grupo
> quot;Transparência Hacker" dos Grupos do Google.
> Para cancelar inscrição nesse grupo e parar de receber e-mails dele, envie
> um e-mail para thackday+unsubscribe em googlegroups.com.
> Para postar nesse grupo, envie um e-mail para thackday em googlegroups.com.
> Acesse esse grupo em http://groups.google.com/group/thackday.
> Para ver essa discussão na Web, acesse
> https://groups.google.com/d/msgid/thackday/CAMcM9karHToAV-ur6KhbLOx%3DqpYqA41qgz8pMBu%3DVTqXK%3D3Nzg%40mail.gmail.com
> <https://groups.google.com/d/msgid/thackday/CAMcM9karHToAV-ur6KhbLOx%3DqpYqA41qgz8pMBu%3DVTqXK%3D3Nzg%40mail.gmail.com?utm_medium=email&utm_source=footer>
> .
>
> Para mais opções, acesse https://groups.google.com/d/optout.
>



-- 
--
"There is a theory which states that if ever anybody discovers exactly
what the Universe is for and why it is here, it will instantly disappear
and be replaced by something even more bizarre and inexplicable. There is
another theory which states that this has already happened."

Douglas Adams
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://lists.okfn.org/pipermail/okfn-br/attachments/20140915/9e062314/attachment-0005.html>


Mais detalhes sobre a lista de discussão okfn-br