[Gastosabertos] Interface para navegar e discutir os Contratos

Andres MRM andres em inventati.org
Quarta Maio 13 21:13:51 UTC 2015


Tá... Hum... Você tem alguma data relacionada a ele além do ano?
Porque o ano de 2014 (supondo que ele teria sido mesmo publicado em 2014) deve
ter alguns milhares de PDFs.... =P
A não ser que eu converta todos (uns 2Gb) com o pdftotext e dê um grep.......


Quoting Edgar Zanella Alvarenga (2015-05-13 17:52:18)
> Exemplo de contrato anexado. Esse é um exemplo onde foi retirado 
> informações
> como CPG e RG das pessoas citadas no contrato.
> 
> E.
> 
> On 13/05/2015 13:34, Andres MRM wrote:
> > De que doc exatamente você está falando?
> > A base "bruta" que eles nos passam está aqui:
> > http://devcolab.each.usp.br/do/baixar
> > Dentro do 7z do ano, deve haver um ZIP por dia.
> > Acho mais fácil você baixar um 7z e ver se há um contrato dentro. Ou 
> > então me
> > passa um contratado do ano passado ou desse e eu tento achar a partir 
> > da data.
> > 
> > 
> > Quoting Edgar Zanella Alvarenga (2015-05-13 13:11:59)
> >> Passa pra mim um desses docs por favor, só pra conferir se está no
> >> acervo de contratos que baixei.
> >> 
> >> E.
> >> 
> >> On 13/05/2015 13:10, Andres MRM wrote:
> >> > Hummm... Bom, então talvez estejam nos PDFs que nós recebemos,
> >> > disponibilizamos como dados brutos, mas não indexamos... =/
> >> >
> >> >
> >> > Quoting Edgar Zanella Alvarenga (2015-05-13 12:39:02)
> >> >> Aquilo era um aditivo de contrato pelo que entendi. Os contratos em
> >> >> geral
> >> >> são PDF's, documentos do Word ou arquivos escaneados.
> >> >>
> >> >> E.
> >> >>
> >> >> On 13/05/2015 12:32, Andres MRM wrote:
> >> >> >> Não achei os contratos no Diário Livre, onde estão?
> >> >> >
> >> >> > **Acho** que são os artigos marcados como "licitações" no DL. Pelo
> >> >> > menos o
> >> >> > contrato que você mandou aqui para a lista estava lá assim.
> >> >> >
> >> >> >> Mas a parte que acho que foge do Diário Livre, pelo menos no modelo
> >> >> >> atual dele é a questão de integrar um sistema de colaboração na
> >> >> >> interface.
> >> >> >>
> >> >> >> Só fornecer os dados brutos é importante, numa interface fácil de
> >> >> >> navegação
> >> >> >> como o Diário Livre faz melhor ainda. Mas tenho curiosidade em qual
> >> >> >> rumo
> >> >> >> tomaria um projeto em que o foco fosse esse, trabalho colaborativo em
> >> >> >> cima
> >> >> >> dos documentos da forma mais trivial possível. Por isso um thread de
> >> >> >> discussão,
> >> >> >> sistema binário de votos (Bom x Problemático "falta info", "não foi
> >> >> >> feito",
> >> >> >> etc)
> >> >> >> e a única parte mais elaborada seria a  extração de dados como
> >> >> >> "quantidade"
> >> >> >> (kg
> >> >> >> de bananas) e "valor" (10.000kg).
> >> >> >
> >> >> > É, dai eu também não tenho claro como seria essa integração...
> >> >> >
> >> >> >
> >> >> >
> >> >> > Quoting Paula Oda (2015-05-13 11:13:26)
> >> >> >> Edgar,
> >> >> >>
> >> >> >> Acho bem legal a proposta.
> >> >> >> A criação de uma página simples, como voce sugeriu inicialmente, pode
> >> >> >> ajudar a
> >> >> >> formar um grupo em torno dessa discussão e dai progredimos um pouco na
> >> >> >> questão
> >> >> >> do contexto de comunidade e direcionar as iniciativas que tomaríamos
> >> >> >> neste
> >> >> >> tópico. E o trabalho colaborativo entra bastante nessa vertente, acho
> >> >> >> que da
> >> >> >> pra pensar nisso com mais calma.
> >> >> >>
> >> >> >> A vantagem da interação com o Diário Livre é inclusive aproveitar os
> >> >> >> usuários/
> >> >> >> pesquisadores dessas informações. Acho válido.
> >> >> >> Nessa mesma linha, tem o email que o Tom mandou para conversarmos com
> >> >> >> a
> >> >> >> Fernanda e com a própria Gisele....
> >> >> >>
> >> >> >> Acho que tem muita ideia pra organizar com isso!
> >> >> >>
> >> >> >> De forma mais pragmática....não podemos esquecer de levantar quanta
> >> >> >> dedicação e
> >> >> >> desenvolvimento seria necessário para essa proposta inicial, ainda
> >> >> >> mais nesse
> >> >> >> momento que estamos de reestruturação do projeto!
> >> >> >>
> >> >> >> Só peço um pouquinho de calma para conseguirmos organizar as coisas
> >> >> >> antes de
> >> >> >> sairmos fazendo (mas fiquem a vontade para continuar discutindo o
> >> >> >> assunto
> >> >> >> rs).... ;)
> >> >> >> Ainda estou organizando as ideias, vendo o que vocês já levantaram e
> >> >> >> etc
> >> >> >>
> >> >> >> Paula Oda
> >> >> >>
> >> >> >> 2015-05-13 10:33 GMT-03:00 Edgar Zanella Alvarenga <e em vaz.io>:
> >> >> >>
> >> >> >>     Não achei os contratos no Diário Livre, onde estão?
> >> >> >>
> >> >> >>     Quanto a busca textual, sim, seria uma boa e minha idéia seria o
> >> >> >> Solr.
> >> >> >>
> >> >> >>     Mas a parte que acho que foge do Diário Livre, pelo menos no
> >> >> >> modelo
> >> >> >>     atual dele é a questão de integrar um sistema de colaboração na
> >> >> >> interface.
> >> >> >>
> >> >> >>     Só fornecer os dados brutos é importante, numa interface fácil de
> >> >> >> navegação
> >> >> >>     como o Diário Livre faz melhor ainda. Mas tenho curiosidade em
> >> >> >> qual rumo
> >> >> >>     tomaria um projeto em que o foco fosse esse, trabalho colaborativo
> >> >> >> em cima
> >> >> >>     dos documentos da forma mais trivial possível. Por isso um thread
> >> >> >> de
> >> >> >>     discussão,
> >> >> >>     sistema binário de votos (Bom x Problemático "falta info", "não
> >> >> >> foi feito",
> >> >> >>     etc)
> >> >> >>     e a única parte mais elaborada seria a  extração de dados como
> >> >> >> "quantidade"
> >> >> >>     (kg
> >> >> >>     de bananas) e "valor" (10.000kg).
> >> >> >>
> >> >> >>     Mas acho que seria legal uma integração com o Diário Livre, por
> >> >> >> exemplo,
> >> >> >>     na página de uma licitação possuir um link pro arquivo do
> >> >> >> contrato.
> >> >> >>
> >> >> >>     E.
> >> >> >>
> >> >> >>
> >> >> >>     On 13/05/2015 08:23, Andres MRM wrote:
> >> >> >>
> >> >> >>         Talvez fosse legal integrar com o Diário Livre, já que os
> >> >> >> contratos
> >> >> >>         parecem
> >> >> >>         estar lá também. Só não sei como seria isso...
> >> >> >>
> >> >> >>         Bom, acho que na pior das hipóteses podemos tentar unir
> >> >> >> através de URLs
> >> >> >>         únicos
> >> >> >>         para os contratos em cada sistema...
> >> >> >>         Peter, o LexML cobre contratos?
> >> >> >>
> >> >> >>         Acho que seria bom permitir busca no texto dos contratos, não?
> >> >> >> Você
> >> >> >>         disse que
> >> >> >>         são vários Gb? Já sabe o que vai usar para isso? O DL usa Solr
> >> >> >> com uma
> >> >> >>         interface de BlackLight.
> >> >> >>
> >> >> >>
> >> >> >>         Quoting Everton Zanella Alvarenga (2015-05-13 01:34:17)
> >> >> >>
> >> >> >>             Sim, esse é o caminho. Acho ótimo. Mas temos que desenhar
> >> >> >>             direitinho a
> >> >> >>             interface para ser simples e haver participação de mais
> >> >> >> pessoas
> >> >> >>             (entendendo o
> >> >> >>             que estão fazendo, hehe).
> >> >> >>
> >> >> >>             O Hypothesis <https://hypothes.is/> pode colocar tag e
> >> >> >> responder um
> >> >> >>             comentário.
> >> >> >>             Por que não acha que é suficiente? Se falta alguma
> >> >> >> característica,
> >> >> >>             não seria
> >> >> >>             legal fazer em cima dele?
> >> >> >>
> >> >> >>             E se formar uma comunidade, os contratos mal formatados
> >> >> >> não terão
> >> >> >>             que passar
> >> >> >>             por um crowsourcing para extrairmos os metadados? Por isso
> >> >> >> falei do
> >> >> >>             Crowd
> >> >> >>             Crafting <http://crowdcrafting.org/>, que usa o PyBossa.
> >> >> >>
> >> >> >>
> >> >> >>             Em 13 de maio de 2015 01:11, Edgar Zanella Alvarenga
> >> >> >> <e em vaz.io>
> >> >> >>             escreveu:
> >> >> >>
> >> >> >>                 Uma primeira proposta de desenvolvimento em cima dos
> >> >> >> dados de
> >> >> >>             contrato
> >> >> >>                 seria criarmos uma simples página onde pudesse navegar
> >> >> >> de forma
> >> >> >>             mais
> >> >> >>                 eficiente pelos contratos. Com paginação funcional,
> >> >> >> busca e o
> >> >> >>             mais
> >> >> >>                 importante:
> >> >> >>                 possibilidade de comentários externos e uma edição
> >> >> >> colaborativa
> >> >> >>             de dados
> >> >> >>                 como valores dos contratos, assim qualquer um poderia
> >> >> >> editar os
> >> >> >>             valores
> >> >> >>                 errados. O que acham?
> >> >> >>
> >> >> >>                 Seria legal se a cada contrato estivesse associado uma
> >> >> >>             discussão, estilo
> >> >> >>                 um fórum. Daí os contratos com mais comentários, mais
> >> >> >>             movimentação poderia
> >> >> >>                 naturalmente subir no topo de uma lista dos contratos
> >> >> >> mais
> >> >> >>             polêmicos.
> >> >> >>
> >> >> >>                 Desse modo estaríamos dando um ótimo exemplo de uso
> >> >> >> onde a
> >> >> >>             população
> >> >> >>                 poderia
> >> >> >>                 participar de forma ativa na análise e discussão em
> >> >> >> cima da
> >> >> >>             execução
> >> >> >>                 orçamentária. E seria um ótimo exemplo de crowd
> >> >> >> sourcing ao
> >> >> >>             invés de
> >> >> >>                 centralizarmos o trabalho somente no grupo do Gastos
> >> >> >> Abertos e
> >> >> >>             dos nossos
> >> >> >>                 parceiros. Sim, vamos ter bastante coisas para fazer,
> >> >> >> mas quem
> >> >> >>             sabe quais
> >> >> >>                 tipos de contribuição teremos se deixarmos um site
> >> >> >> simples e de
> >> >> >>             fácil
> >> >> >>                 colaboração?
> >> >> >>
> >> >> >>                 O que acham?
> >> >> >>                 Edgar
> >> >> >>                 _______________________________________________
> >> >> >>                 Gastosabertos mailing list
> >> >> >>                 Gastosabertos em lists.okfn.org
> >> >> >>                 https://lists.okfn.org/mailman/listinfo/gastosabertos
> >> >> >>
> >> >> >>
> >> >> >>
> >> >> >>
> >> >> >>             --
> >> >> >>             Everton Zanella Alvarenga (also Tom)
> >> >> >>             Open Knowledge Brasil - Rede pelo Conhecimento Livre
> >> >> >>             http://br.okfn.org
> >> >> >>
> >> >> >>         _______________________________________________
> >> >> >>         Gastosabertos mailing list
> >> >> >>         Gastosabertos em lists.okfn.org
> >> >> >>         https://lists.okfn.org/mailman/listinfo/gastosabertos
> >> >> >>
> >> >> >>     _______________________________________________
> >> >> >>     Gastosabertos mailing list
> >> >> >>     Gastosabertos em lists.okfn.org
> >> >> >>     https://lists.okfn.org/mailman/listinfo/gastosabertos
> >> >> >>
> >> >> >>
> >> >> >>
> >> >> >>
> >> >> >> --
> >> >> >> Paula Oda
> >> >> > _______________________________________________
> >> >> > Gastosabertos mailing list
> >> >> > Gastosabertos em lists.okfn.org
> >> >> > https://lists.okfn.org/mailman/listinfo/gastosabertos
> >> >> _______________________________________________
> >> >> Gastosabertos mailing list
> >> >> Gastosabertos em lists.okfn.org
> >> >> https://lists.okfn.org/mailman/listinfo/gastosabertos
> >> > _______________________________________________
> >> > Gastosabertos mailing list
> >> > Gastosabertos em lists.okfn.org
> >> > https://lists.okfn.org/mailman/listinfo/gastosabertos
> >> _______________________________________________
> >> Gastosabertos mailing list
> >> Gastosabertos em lists.okfn.org
> >> https://lists.okfn.org/mailman/listinfo/gastosabertos
> > _______________________________________________
> > Gastosabertos mailing list
> > Gastosabertos em lists.okfn.org
> > https://lists.okfn.org/mailman/listinfo/gastosabertos
> 
> _______________________________________________
> Gastosabertos mailing list
> Gastosabertos em lists.okfn.org
> https://lists.okfn.org/mailman/listinfo/gastosabertos



Mais detalhes sobre a lista de discussão Gastosabertos