[Gastosabertos-dev] Comparando informações das planilhas de planejamento 2015

Edgar Zanella Alvarenga e em vaz.io
Domingo Janeiro 25 18:33:01 UTC 2015


On 25/01/2015 16:19, Andres MRM wrote:
> Ou seja, só teremos dados de um ano, certo?

Não Andres, como assim? Quadro detalhado possuímos de 2015,
mas não detalhado possuímos 2013, 2014 e 2015, pelo menos pelo
site:

http://sempla.prefeitura.sp.gov.br/orcamento/proposta.html

E pelo link que você passou:

http://www.camara.sp.gov.br/transparencia/dados-abertos/1071-2/

Temos as propostas até 2010. Aliás, é fantástico que aí possui
as emendas do orçamento junto com os autores responsáveis por elas.
Fiz um conversor pra esses xmls pra criar csv e dataframes do pandas:

https://github.com/okfn-brasil/gastos_abertos_dados/blob/master/utils/convert_xml.py

E testando com o xml de emendas de 2014 mais o xml do autores delas,
pareceu funcionar. Só preciso entender a interpretar algumas linhas
das emendas que possuem quase todos os campos vazios, e com id da 
emenda
igual a da linha anterior.

Precisamos verificar se os xml dos dados do orçamento convertidos 
possuem
os mesmos dados do quadro detalhado.

E.

> Quoting Edgar Zanella Alvarenga (2015-01-25 16:08:27)
>> On 25/01/2015 08:23, Andres MRM wrote:
>>
>> > Tem outro problema com esses dados, cobrem poucas datas.
>> > O LOA é só de 2014, e o Quadro Detalhado só de 2015.
>>
>> O LOA de 2014 refere-se ao Quadro Detalhado de 2015.
>>
>> > O Projeto de Lei tem de 2013-2015, mas a regionalização é quase
>> > inexistente
>> > nessa base.
>>
>> Sim, mas como comentei, a regionalização vamos tirar do Quadro
>> Detalhado
>> que é onde existe tais informações.
>>
>> > Quoting Edgar Zanella Alvarenga (2015-01-24 23:16:34)
>> >> Fiz algumas comparações das duas planilhas de planejamento que
>> >> iremos utilizar antes de iniciar o processo de criar os modelos
>> >> de dados.
>> >>
>> >>
>> >> 
>> http://nbviewer.ipython.org/github/okfn-brasil/gastos_abertos_dados/blob/master/notebooks/Comparando%20dados%20de%20planejamento.ipynb
>> >>
>> >> Descobri algumas coisas boas:
>> >>
>> >>   * O valor total em projetos é consistente nas duas planilhas
>> >>
>> >>   * Descobri que coisas que pensávamos não estarem regionalizadas
>> >>     por subprefeitura, como por exemplo "Construção de CEI", 
>> estão
>> >>     na planilha com quadro detalhado. Sempre achávamos que nessas
>> >>     planilhas existiam muitas informações que possuiam apenas um
>> >>     total sem a discriminação de quanto deste total iria pra cada
>> >>     subprefeitura. Pelo que observei, pelo menos alguns projetos
>> >>     isso não é verdade. Vejam o notebook acima no exemplo do CEI.
>> >>
>> >> E algumas coisas ruins:
>> >>
>> >>   * O número de colunas difere entre as duas planilhas.
>> >>
>> >>   * Algumas colunas possuem nomes distintos, por exemplo,
>> >> 'ProjetoAtividade'
>> >>     na planilha PLOA467BaseDados.xls é equivalente a coluna 'PA' 
>> na
>> >>     planilha PLOA467BaseDadosQuadroDetalhadoDaAcao.xls.
>> >>
>> >>   * A quantidade de detalhamento difere em cada planilha. Algums
>> >> Projeto/Atividade's
>> >>     hora estão mais detalhados em uma planilha, hora estão em 
>> outra.
>> >> Isso
>> >>     implica que teremos que pensar melhor em como iremos realizar
>> >>     a importação dos dados para nossos modelos de dados. Quando
>> >> pegar as
>> >>     informações de uma planilha e quando pegar da outra? Sim, eu
>> >> sei,
>> >> pegar
>> >>     sempre da planilha com mais informações, mas isso deverá ser
>> >> definido
>> >>     de forma algorítmica por projeto/atividade.
>> >>
>> >> Sugiro fortemente que dêem uma boa lida no notebook que passei
>> >> acima.
>> >>
>> >> E.
>> >>
>> >>
>> >> _______________________________________________
>> >> Gastosabertos-dev mailing list
>> >> Gastosabertos-dev em lists.okfn.org
>> >> https://lists.okfn.org/mailman/listinfo/gastosabertos-dev
>> > _______________________________________________
>> > Gastosabertos-dev mailing list
>> > Gastosabertos-dev em lists.okfn.org
>> > https://lists.okfn.org/mailman/listinfo/gastosabertos-dev
>>
>> _______________________________________________
>> Gastosabertos-dev mailing list
>> Gastosabertos-dev em lists.okfn.org
>> https://lists.okfn.org/mailman/listinfo/gastosabertos-dev
> _______________________________________________
> Gastosabertos-dev mailing list
> Gastosabertos-dev em lists.okfn.org
> https://lists.okfn.org/mailman/listinfo/gastosabertos-dev




Mais detalhes sobre a lista de discussão Gastosabertos-dev