[Gastosabertos-dev] Comparando informações das planilhas de planejamento 2015
Andres MRM
andres em inventati.org
Domingo Janeiro 25 18:47:51 UTC 2015
Quoting Edgar Zanella Alvarenga (2015-01-25 16:33:01)
> On 25/01/2015 16:19, Andres MRM wrote:
> > Ou seja, só teremos dados de um ano, certo?
>
> Não Andres, como assim? Quadro detalhado possuímos de 2015,
> mas não detalhado possuímos 2013, 2014 e 2015, pelo menos pelo
> site:
>
> http://sempla.prefeitura.sp.gov.br/orcamento/proposta.html
Foi exatamente isso que escrevi no meu primeiro e-mail, não?
"Tem outro problema com esses dados, cobrem poucas datas. O LOA é só de
2014, e o Quadro Detalhado só de 2015. O Projeto de Lei tem de 2013-2015,
mas a regionalização é quase inexistente nessa base."
>
> E pelo link que você passou:
>
> http://www.camara.sp.gov.br/transparencia/dados-abertos/1071-2/
>
> Temos as propostas até 2010. Aliás, é fantástico que aí possui
> as emendas do orçamento junto com os autores responsáveis por elas.
> Fiz um conversor pra esses xmls pra criar csv e dataframes do pandas:
>
> https://github.com/okfn-brasil/gastos_abertos_dados/blob/master/utils/convert_xml.py
Eu tinha feito algo próximo a isso quando extraindo os dados da receita via
Câmara:
https://github.com/okfn-brasil/gastos_abertos/tree/master/src/tool
>
> E testando com o xml de emendas de 2014 mais o xml do autores delas,
> pareceu funcionar. Só preciso entender a interpretar algumas linhas
> das emendas que possuem quase todos os campos vazios, e com id da
> emenda
> igual a da linha anterior.
>
> Precisamos verificar se os xml dos dados do orçamento convertidos
> possuem
> os mesmos dados do quadro detalhado.
>
> E.
>
> > Quoting Edgar Zanella Alvarenga (2015-01-25 16:08:27)
> >> On 25/01/2015 08:23, Andres MRM wrote:
> >>
> >> > Tem outro problema com esses dados, cobrem poucas datas.
> >> > O LOA é só de 2014, e o Quadro Detalhado só de 2015.
> >>
> >> O LOA de 2014 refere-se ao Quadro Detalhado de 2015.
> >>
> >> > O Projeto de Lei tem de 2013-2015, mas a regionalização é quase
> >> > inexistente
> >> > nessa base.
> >>
> >> Sim, mas como comentei, a regionalização vamos tirar do Quadro
> >> Detalhado
> >> que é onde existe tais informações.
> >>
> >> > Quoting Edgar Zanella Alvarenga (2015-01-24 23:16:34)
> >> >> Fiz algumas comparações das duas planilhas de planejamento que
> >> >> iremos utilizar antes de iniciar o processo de criar os modelos
> >> >> de dados.
> >> >>
> >> >>
> >> >>
> >> http://nbviewer.ipython.org/github/okfn-brasil/gastos_abertos_dados/blob/master/notebooks/Comparando%20dados%20de%20planejamento.ipynb
> >> >>
> >> >> Descobri algumas coisas boas:
> >> >>
> >> >> * O valor total em projetos é consistente nas duas planilhas
> >> >>
> >> >> * Descobri que coisas que pensávamos não estarem regionalizadas
> >> >> por subprefeitura, como por exemplo "Construção de CEI",
> >> estão
> >> >> na planilha com quadro detalhado. Sempre achávamos que nessas
> >> >> planilhas existiam muitas informações que possuiam apenas um
> >> >> total sem a discriminação de quanto deste total iria pra cada
> >> >> subprefeitura. Pelo que observei, pelo menos alguns projetos
> >> >> isso não é verdade. Vejam o notebook acima no exemplo do CEI.
> >> >>
> >> >> E algumas coisas ruins:
> >> >>
> >> >> * O número de colunas difere entre as duas planilhas.
> >> >>
> >> >> * Algumas colunas possuem nomes distintos, por exemplo,
> >> >> 'ProjetoAtividade'
> >> >> na planilha PLOA467BaseDados.xls é equivalente a coluna 'PA'
> >> na
> >> >> planilha PLOA467BaseDadosQuadroDetalhadoDaAcao.xls.
> >> >>
> >> >> * A quantidade de detalhamento difere em cada planilha. Algums
> >> >> Projeto/Atividade's
> >> >> hora estão mais detalhados em uma planilha, hora estão em
> >> outra.
> >> >> Isso
> >> >> implica que teremos que pensar melhor em como iremos realizar
> >> >> a importação dos dados para nossos modelos de dados. Quando
> >> >> pegar as
> >> >> informações de uma planilha e quando pegar da outra? Sim, eu
> >> >> sei,
> >> >> pegar
> >> >> sempre da planilha com mais informações, mas isso deverá ser
> >> >> definido
> >> >> de forma algorítmica por projeto/atividade.
> >> >>
> >> >> Sugiro fortemente que dêem uma boa lida no notebook que passei
> >> >> acima.
> >> >>
> >> >> E.
> >> >>
> >> >>
> >> >> _______________________________________________
> >> >> Gastosabertos-dev mailing list
> >> >> Gastosabertos-dev em lists.okfn.org
> >> >> https://lists.okfn.org/mailman/listinfo/gastosabertos-dev
> >> > _______________________________________________
> >> > Gastosabertos-dev mailing list
> >> > Gastosabertos-dev em lists.okfn.org
> >> > https://lists.okfn.org/mailman/listinfo/gastosabertos-dev
> >>
> >> _______________________________________________
> >> Gastosabertos-dev mailing list
> >> Gastosabertos-dev em lists.okfn.org
> >> https://lists.okfn.org/mailman/listinfo/gastosabertos-dev
> > _______________________________________________
> > Gastosabertos-dev mailing list
> > Gastosabertos-dev em lists.okfn.org
> > https://lists.okfn.org/mailman/listinfo/gastosabertos-dev
>
> _______________________________________________
> Gastosabertos-dev mailing list
> Gastosabertos-dev em lists.okfn.org
> https://lists.okfn.org/mailman/listinfo/gastosabertos-dev
Mais detalhes sobre a lista de discussão Gastosabertos-dev