[Gastosabertos-dev] Comparando informações das planilhas de planejamento 2015
Andres MRM
andres em inventati.org
Domingo Janeiro 25 19:07:40 UTC 2015
Quoting Edgar Zanella Alvarenga (2015-01-25 17:02:41)
> On 25/01/2015 16:47, Andres MRM wrote:
> > Quoting Edgar Zanella Alvarenga (2015-01-25 16:33:01)
> >> On 25/01/2015 16:19, Andres MRM wrote:
> >> > Ou seja, só teremos dados de um ano, certo?
> >>
> >> Não Andres, como assim? Quadro detalhado possuímos de 2015,
> >> mas não detalhado possuímos 2013, 2014 e 2015, pelo menos pelo
> >> site:
> >>
> >> http://sempla.prefeitura.sp.gov.br/orcamento/proposta.html
> >
> > Foi exatamente isso que escrevi no meu primeiro e-mail, não?
> >
> > "Tem outro problema com esses dados, cobrem poucas datas. O LOA é
> > só de
> > 2014, e o Quadro Detalhado só de 2015. O Projeto de Lei tem de
> > 2013-2015,
> > mas a regionalização é quase inexistente nessa base."
>
> Exatamente por isso que não entendi quando disse: "Ou seja, só teremos
> dados de um ano, certo?".
> Quadro detalhado sim, mas possuímos dados de diversos anos. Se
> possuímos
> apenas 2015 detalhado, fica como uma ótima oportunidade de perguntar ao
> pessoal do Sempla se é possível extrair os quadros detalhados de todos
> anos.
Podemos tentar... Mas acho que eles só começaram a se organizar
"geograficamente" agora. Depois de bastante gente pedir, inclusive a Gisele.
Apesar de que acho que vi algo do tipo nos PDFs antigos... O problema é
extrair, se é que não estou me confundindo.
>
> E mesmo os dados sem detalhamento regional, os dados estão agrupados
> por funções
> e subfunções, então a idéia de analisarmos as diferenças por função ao
> longo dos
> anos continua. Apenas não conseguiremos fazer os gráficos comparativos
> entre
> subprefeituras/distritos com o grau de granularidade de 2015.
É... tem razão.
>
> >> E pelo link que você passou:
> >>
> >> http://www.camara.sp.gov.br/transparencia/dados-abertos/1071-2/
> >>
> >> Temos as propostas até 2010. Aliás, é fantástico que aí possui
> >> as emendas do orçamento junto com os autores responsáveis por elas.
> >> Fiz um conversor pra esses xmls pra criar csv e dataframes do
> >> pandas:
> >>
> >>
> >> https://github.com/okfn-brasil/gastos_abertos_dados/blob/master/utils/convert_xml.py
> >
> > Eu tinha feito algo próximo a isso quando extraindo os dados da
> > receita via
> > Câmara:
> > https://github.com/okfn-brasil/gastos_abertos/tree/master/src/tool
>
> Pô, Pandas é seu amigo, vai salvá-lo do perigo! ;^)
Haha, ok. =P
>
> >> E testando com o xml de emendas de 2014 mais o xml do autores delas,
> >> pareceu funcionar. Só preciso entender a interpretar algumas linhas
> >> das emendas que possuem quase todos os campos vazios, e com id da
> >> emenda
> >> igual a da linha anterior.
> >>
> >> Precisamos verificar se os xml dos dados do orçamento convertidos
> >> possuem
> >> os mesmos dados do quadro detalhado.
> >>
> >> E.
> >>
> >> > Quoting Edgar Zanella Alvarenga (2015-01-25 16:08:27)
> >> >> On 25/01/2015 08:23, Andres MRM wrote:
> >> >>
> >> >> > Tem outro problema com esses dados, cobrem poucas datas.
> >> >> > O LOA é só de 2014, e o Quadro Detalhado só de 2015.
> >> >>
> >> >> O LOA de 2014 refere-se ao Quadro Detalhado de 2015.
> >> >>
> >> >> > O Projeto de Lei tem de 2013-2015, mas a regionalização é quase
> >> >> > inexistente
> >> >> > nessa base.
> >> >>
> >> >> Sim, mas como comentei, a regionalização vamos tirar do Quadro
> >> >> Detalhado
> >> >> que é onde existe tais informações.
> >> >>
> >> >> > Quoting Edgar Zanella Alvarenga (2015-01-24 23:16:34)
> >> >> >> Fiz algumas comparações das duas planilhas de planejamento que
> >> >> >> iremos utilizar antes de iniciar o processo de criar os
> >> modelos
> >> >> >> de dados.
> >> >> >>
> >> >> >>
> >> >> >>
> >> >>
> >> http://nbviewer.ipython.org/github/okfn-brasil/gastos_abertos_dados/blob/master/notebooks/Comparando%20dados%20de%20planejamento.ipynb
> >> >> >>
> >> >> >> Descobri algumas coisas boas:
> >> >> >>
> >> >> >> * O valor total em projetos é consistente nas duas planilhas
> >> >> >>
> >> >> >> * Descobri que coisas que pensávamos não estarem
> >> regionalizadas
> >> >> >> por subprefeitura, como por exemplo "Construção de CEI",
> >> >> estão
> >> >> >> na planilha com quadro detalhado. Sempre achávamos que
> >> nessas
> >> >> >> planilhas existiam muitas informações que possuiam apenas
> >> um
> >> >> >> total sem a discriminação de quanto deste total iria pra
> >> cada
> >> >> >> subprefeitura. Pelo que observei, pelo menos alguns
> >> projetos
> >> >> >> isso não é verdade. Vejam o notebook acima no exemplo do
> >> CEI.
> >> >> >>
> >> >> >> E algumas coisas ruins:
> >> >> >>
> >> >> >> * O número de colunas difere entre as duas planilhas.
> >> >> >>
> >> >> >> * Algumas colunas possuem nomes distintos, por exemplo,
> >> >> >> 'ProjetoAtividade'
> >> >> >> na planilha PLOA467BaseDados.xls é equivalente a coluna
> >> 'PA'
> >> >> na
> >> >> >> planilha PLOA467BaseDadosQuadroDetalhadoDaAcao.xls.
> >> >> >>
> >> >> >> * A quantidade de detalhamento difere em cada planilha.
> >> Algums
> >> >> >> Projeto/Atividade's
> >> >> >> hora estão mais detalhados em uma planilha, hora estão em
> >> >> outra.
> >> >> >> Isso
> >> >> >> implica que teremos que pensar melhor em como iremos
> >> realizar
> >> >> >> a importação dos dados para nossos modelos de dados.
> >> Quando
> >> >> >> pegar as
> >> >> >> informações de uma planilha e quando pegar da outra? Sim,
> >> eu
> >> >> >> sei,
> >> >> >> pegar
> >> >> >> sempre da planilha com mais informações, mas isso deverá
> >> ser
> >> >> >> definido
> >> >> >> de forma algorítmica por projeto/atividade.
> >> >> >>
> >> >> >> Sugiro fortemente que dêem uma boa lida no notebook que passei
> >> >> >> acima.
> >> >> >>
> >> >> >> E.
> >> >> >>
> >> >> >>
> >> >> >> _______________________________________________
> >> >> >> Gastosabertos-dev mailing list
> >> >> >> Gastosabertos-dev em lists.okfn.org
> >> >> >> https://lists.okfn.org/mailman/listinfo/gastosabertos-dev
> >> >> > _______________________________________________
> >> >> > Gastosabertos-dev mailing list
> >> >> > Gastosabertos-dev em lists.okfn.org
> >> >> > https://lists.okfn.org/mailman/listinfo/gastosabertos-dev
> >> >>
> >> >> _______________________________________________
> >> >> Gastosabertos-dev mailing list
> >> >> Gastosabertos-dev em lists.okfn.org
> >> >> https://lists.okfn.org/mailman/listinfo/gastosabertos-dev
> >> > _______________________________________________
> >> > Gastosabertos-dev mailing list
> >> > Gastosabertos-dev em lists.okfn.org
> >> > https://lists.okfn.org/mailman/listinfo/gastosabertos-dev
> >>
> >> _______________________________________________
> >> Gastosabertos-dev mailing list
> >> Gastosabertos-dev em lists.okfn.org
> >> https://lists.okfn.org/mailman/listinfo/gastosabertos-dev
> > _______________________________________________
> > Gastosabertos-dev mailing list
> > Gastosabertos-dev em lists.okfn.org
> > https://lists.okfn.org/mailman/listinfo/gastosabertos-dev
>
> _______________________________________________
> Gastosabertos-dev mailing list
> Gastosabertos-dev em lists.okfn.org
> https://lists.okfn.org/mailman/listinfo/gastosabertos-dev
Mais detalhes sobre a lista de discussão Gastosabertos-dev