[Gastosabertos] Interface para navegar e discutir os Contratos

Edgar Zanella Alvarenga e em vaz.io
Quarta Maio 13 21:52:58 UTC 2015


Mas buscando pelo número do processo no diário livre (2014-0.024.634-9)
deu pra ver que não existe o contrato lá. Ou não esta indexado.

E.

On 13/05/2015 18:31, Edgar Zanella Alvarenga wrote:
> Data de Publicação:  31/12/2014
> Data de Assinatura:  13/5/2014
> 
> On 13/05/2015 18:13, Andres MRM wrote:
>> Tá... Hum... Você tem alguma data relacionada a ele além do ano?
>> Porque o ano de 2014 (supondo que ele teria sido mesmo publicado em 
>> 2014) deve
>> ter alguns milhares de PDFs.... =P
>> A não ser que eu converta todos (uns 2Gb) com o pdftotext e dê um 
>> grep.......
>> 
>> 
>> Quoting Edgar Zanella Alvarenga (2015-05-13 17:52:18)
>>> Exemplo de contrato anexado. Esse é um exemplo onde foi retirado
>>> informações
>>> como CPG e RG das pessoas citadas no contrato.
>>> 
>>> E.
>>> 
>>> On 13/05/2015 13:34, Andres MRM wrote:
>>> > De que doc exatamente você está falando?
>>> > A base "bruta" que eles nos passam está aqui:
>>> > http://devcolab.each.usp.br/do/baixar
>>> > Dentro do 7z do ano, deve haver um ZIP por dia.
>>> > Acho mais fácil você baixar um 7z e ver se há um contrato dentro. Ou
>>> > então me
>>> > passa um contratado do ano passado ou desse e eu tento achar a partir
>>> > da data.
>>> >
>>> >
>>> > Quoting Edgar Zanella Alvarenga (2015-05-13 13:11:59)
>>> >> Passa pra mim um desses docs por favor, só pra conferir se está no
>>> >> acervo de contratos que baixei.
>>> >>
>>> >> E.
>>> >>
>>> >> On 13/05/2015 13:10, Andres MRM wrote:
>>> >> > Hummm... Bom, então talvez estejam nos PDFs que nós recebemos,
>>> >> > disponibilizamos como dados brutos, mas não indexamos... =/
>>> >> >
>>> >> >
>>> >> > Quoting Edgar Zanella Alvarenga (2015-05-13 12:39:02)
>>> >> >> Aquilo era um aditivo de contrato pelo que entendi. Os contratos em
>>> >> >> geral
>>> >> >> são PDF's, documentos do Word ou arquivos escaneados.
>>> >> >>
>>> >> >> E.
>>> >> >>
>>> >> >> On 13/05/2015 12:32, Andres MRM wrote:
>>> >> >> >> Não achei os contratos no Diário Livre, onde estão?
>>> >> >> >
>>> >> >> > **Acho** que são os artigos marcados como "licitações" no DL. Pelo
>>> >> >> > menos o
>>> >> >> > contrato que você mandou aqui para a lista estava lá assim.
>>> >> >> >
>>> >> >> >> Mas a parte que acho que foge do Diário Livre, pelo menos no modelo
>>> >> >> >> atual dele é a questão de integrar um sistema de colaboração na
>>> >> >> >> interface.
>>> >> >> >>
>>> >> >> >> Só fornecer os dados brutos é importante, numa interface fácil de
>>> >> >> >> navegação
>>> >> >> >> como o Diário Livre faz melhor ainda. Mas tenho curiosidade em qual
>>> >> >> >> rumo
>>> >> >> >> tomaria um projeto em que o foco fosse esse, trabalho colaborativo em
>>> >> >> >> cima
>>> >> >> >> dos documentos da forma mais trivial possível. Por isso um thread de
>>> >> >> >> discussão,
>>> >> >> >> sistema binário de votos (Bom x Problemático "falta info", "não foi
>>> >> >> >> feito",
>>> >> >> >> etc)
>>> >> >> >> e a única parte mais elaborada seria a  extração de dados como
>>> >> >> >> "quantidade"
>>> >> >> >> (kg
>>> >> >> >> de bananas) e "valor" (10.000kg).
>>> >> >> >
>>> >> >> > É, dai eu também não tenho claro como seria essa integração...
>>> >> >> >
>>> >> >> >
>>> >> >> >
>>> >> >> > Quoting Paula Oda (2015-05-13 11:13:26)
>>> >> >> >> Edgar,
>>> >> >> >>
>>> >> >> >> Acho bem legal a proposta.
>>> >> >> >> A criação de uma página simples, como voce sugeriu inicialmente, pode
>>> >> >> >> ajudar a
>>> >> >> >> formar um grupo em torno dessa discussão e dai progredimos um pouco na
>>> >> >> >> questão
>>> >> >> >> do contexto de comunidade e direcionar as iniciativas que tomaríamos
>>> >> >> >> neste
>>> >> >> >> tópico. E o trabalho colaborativo entra bastante nessa vertente, acho
>>> >> >> >> que da
>>> >> >> >> pra pensar nisso com mais calma.
>>> >> >> >>
>>> >> >> >> A vantagem da interação com o Diário Livre é inclusive aproveitar os
>>> >> >> >> usuários/
>>> >> >> >> pesquisadores dessas informações. Acho válido.
>>> >> >> >> Nessa mesma linha, tem o email que o Tom mandou para conversarmos com
>>> >> >> >> a
>>> >> >> >> Fernanda e com a própria Gisele....
>>> >> >> >>
>>> >> >> >> Acho que tem muita ideia pra organizar com isso!
>>> >> >> >>
>>> >> >> >> De forma mais pragmática....não podemos esquecer de levantar quanta
>>> >> >> >> dedicação e
>>> >> >> >> desenvolvimento seria necessário para essa proposta inicial, ainda
>>> >> >> >> mais nesse
>>> >> >> >> momento que estamos de reestruturação do projeto!
>>> >> >> >>
>>> >> >> >> Só peço um pouquinho de calma para conseguirmos organizar as coisas
>>> >> >> >> antes de
>>> >> >> >> sairmos fazendo (mas fiquem a vontade para continuar discutindo o
>>> >> >> >> assunto
>>> >> >> >> rs).... ;)
>>> >> >> >> Ainda estou organizando as ideias, vendo o que vocês já levantaram e
>>> >> >> >> etc
>>> >> >> >>
>>> >> >> >> Paula Oda
>>> >> >> >>
>>> >> >> >> 2015-05-13 10:33 GMT-03:00 Edgar Zanella Alvarenga <e em vaz.io>:
>>> >> >> >>
>>> >> >> >>     Não achei os contratos no Diário Livre, onde estão?
>>> >> >> >>
>>> >> >> >>     Quanto a busca textual, sim, seria uma boa e minha idéia seria o
>>> >> >> >> Solr.
>>> >> >> >>
>>> >> >> >>     Mas a parte que acho que foge do Diário Livre, pelo menos no
>>> >> >> >> modelo
>>> >> >> >>     atual dele é a questão de integrar um sistema de colaboração na
>>> >> >> >> interface.
>>> >> >> >>
>>> >> >> >>     Só fornecer os dados brutos é importante, numa interface fácil de
>>> >> >> >> navegação
>>> >> >> >>     como o Diário Livre faz melhor ainda. Mas tenho curiosidade em
>>> >> >> >> qual rumo
>>> >> >> >>     tomaria um projeto em que o foco fosse esse, trabalho colaborativo
>>> >> >> >> em cima
>>> >> >> >>     dos documentos da forma mais trivial possível. Por isso um thread
>>> >> >> >> de
>>> >> >> >>     discussão,
>>> >> >> >>     sistema binário de votos (Bom x Problemático "falta info", "não
>>> >> >> >> foi feito",
>>> >> >> >>     etc)
>>> >> >> >>     e a única parte mais elaborada seria a  extração de dados como
>>> >> >> >> "quantidade"
>>> >> >> >>     (kg
>>> >> >> >>     de bananas) e "valor" (10.000kg).
>>> >> >> >>
>>> >> >> >>     Mas acho que seria legal uma integração com o Diário Livre, por
>>> >> >> >> exemplo,
>>> >> >> >>     na página de uma licitação possuir um link pro arquivo do
>>> >> >> >> contrato.
>>> >> >> >>
>>> >> >> >>     E.
>>> >> >> >>
>>> >> >> >>
>>> >> >> >>     On 13/05/2015 08:23, Andres MRM wrote:
>>> >> >> >>
>>> >> >> >>         Talvez fosse legal integrar com o Diário Livre, já que os
>>> >> >> >> contratos
>>> >> >> >>         parecem
>>> >> >> >>         estar lá também. Só não sei como seria isso...
>>> >> >> >>
>>> >> >> >>         Bom, acho que na pior das hipóteses podemos tentar unir
>>> >> >> >> através de URLs
>>> >> >> >>         únicos
>>> >> >> >>         para os contratos em cada sistema...
>>> >> >> >>         Peter, o LexML cobre contratos?
>>> >> >> >>
>>> >> >> >>         Acho que seria bom permitir busca no texto dos contratos, não?
>>> >> >> >> Você
>>> >> >> >>         disse que
>>> >> >> >>         são vários Gb? Já sabe o que vai usar para isso? O DL usa Solr
>>> >> >> >> com uma
>>> >> >> >>         interface de BlackLight.
>>> >> >> >>
>>> >> >> >>
>>> >> >> >>         Quoting Everton Zanella Alvarenga (2015-05-13 01:34:17)
>>> >> >> >>
>>> >> >> >>             Sim, esse é o caminho. Acho ótimo. Mas temos que desenhar
>>> >> >> >>             direitinho a
>>> >> >> >>             interface para ser simples e haver participação de mais
>>> >> >> >> pessoas
>>> >> >> >>             (entendendo o
>>> >> >> >>             que estão fazendo, hehe).
>>> >> >> >>
>>> >> >> >>             O Hypothesis <https://hypothes.is/> pode colocar tag e
>>> >> >> >> responder um
>>> >> >> >>             comentário.
>>> >> >> >>             Por que não acha que é suficiente? Se falta alguma
>>> >> >> >> característica,
>>> >> >> >>             não seria
>>> >> >> >>             legal fazer em cima dele?
>>> >> >> >>
>>> >> >> >>             E se formar uma comunidade, os contratos mal formatados
>>> >> >> >> não terão
>>> >> >> >>             que passar
>>> >> >> >>             por um crowsourcing para extrairmos os metadados? Por isso
>>> >> >> >> falei do
>>> >> >> >>             Crowd
>>> >> >> >>             Crafting <http://crowdcrafting.org/>, que usa o PyBossa.
>>> >> >> >>
>>> >> >> >>
>>> >> >> >>             Em 13 de maio de 2015 01:11, Edgar Zanella Alvarenga
>>> >> >> >> <e em vaz.io>
>>> >> >> >>             escreveu:
>>> >> >> >>
>>> >> >> >>                 Uma primeira proposta de desenvolvimento em cima dos
>>> >> >> >> dados de
>>> >> >> >>             contrato
>>> >> >> >>                 seria criarmos uma simples página onde pudesse navegar
>>> >> >> >> de forma
>>> >> >> >>             mais
>>> >> >> >>                 eficiente pelos contratos. Com paginação funcional,
>>> >> >> >> busca e o
>>> >> >> >>             mais
>>> >> >> >>                 importante:
>>> >> >> >>                 possibilidade de comentários externos e uma edição
>>> >> >> >> colaborativa
>>> >> >> >>             de dados
>>> >> >> >>                 como valores dos contratos, assim qualquer um poderia
>>> >> >> >> editar os
>>> >> >> >>             valores
>>> >> >> >>                 errados. O que acham?
>>> >> >> >>
>>> >> >> >>                 Seria legal se a cada contrato estivesse associado uma
>>> >> >> >>             discussão, estilo
>>> >> >> >>                 um fórum. Daí os contratos com mais comentários, mais
>>> >> >> >>             movimentação poderia
>>> >> >> >>                 naturalmente subir no topo de uma lista dos contratos
>>> >> >> >> mais
>>> >> >> >>             polêmicos.
>>> >> >> >>
>>> >> >> >>                 Desse modo estaríamos dando um ótimo exemplo de uso
>>> >> >> >> onde a
>>> >> >> >>             população
>>> >> >> >>                 poderia
>>> >> >> >>                 participar de forma ativa na análise e discussão em
>>> >> >> >> cima da
>>> >> >> >>             execução
>>> >> >> >>                 orçamentária. E seria um ótimo exemplo de crowd
>>> >> >> >> sourcing ao
>>> >> >> >>             invés de
>>> >> >> >>                 centralizarmos o trabalho somente no grupo do Gastos
>>> >> >> >> Abertos e
>>> >> >> >>             dos nossos
>>> >> >> >>                 parceiros. Sim, vamos ter bastante coisas para fazer,
>>> >> >> >> mas quem
>>> >> >> >>             sabe quais
>>> >> >> >>                 tipos de contribuição teremos se deixarmos um site
>>> >> >> >> simples e de
>>> >> >> >>             fácil
>>> >> >> >>                 colaboração?
>>> >> >> >>
>>> >> >> >>                 O que acham?
>>> >> >> >>                 Edgar
>>> >> >> >>                 _______________________________________________
>>> >> >> >>                 Gastosabertos mailing list
>>> >> >> >>                 Gastosabertos em lists.okfn.org
>>> >> >> >>                 https://lists.okfn.org/mailman/listinfo/gastosabertos
>>> >> >> >>
>>> >> >> >>
>>> >> >> >>
>>> >> >> >>
>>> >> >> >>             --
>>> >> >> >>             Everton Zanella Alvarenga (also Tom)
>>> >> >> >>             Open Knowledge Brasil - Rede pelo Conhecimento Livre
>>> >> >> >>             http://br.okfn.org
>>> >> >> >>
>>> >> >> >>         _______________________________________________
>>> >> >> >>         Gastosabertos mailing list
>>> >> >> >>         Gastosabertos em lists.okfn.org
>>> >> >> >>         https://lists.okfn.org/mailman/listinfo/gastosabertos
>>> >> >> >>
>>> >> >> >>     _______________________________________________
>>> >> >> >>     Gastosabertos mailing list
>>> >> >> >>     Gastosabertos em lists.okfn.org
>>> >> >> >>     https://lists.okfn.org/mailman/listinfo/gastosabertos
>>> >> >> >>
>>> >> >> >>
>>> >> >> >>
>>> >> >> >>
>>> >> >> >> --
>>> >> >> >> Paula Oda
>>> >> >> > _______________________________________________
>>> >> >> > Gastosabertos mailing list
>>> >> >> > Gastosabertos em lists.okfn.org
>>> >> >> > https://lists.okfn.org/mailman/listinfo/gastosabertos
>>> >> >> _______________________________________________
>>> >> >> Gastosabertos mailing list
>>> >> >> Gastosabertos em lists.okfn.org
>>> >> >> https://lists.okfn.org/mailman/listinfo/gastosabertos
>>> >> > _______________________________________________
>>> >> > Gastosabertos mailing list
>>> >> > Gastosabertos em lists.okfn.org
>>> >> > https://lists.okfn.org/mailman/listinfo/gastosabertos
>>> >> _______________________________________________
>>> >> Gastosabertos mailing list
>>> >> Gastosabertos em lists.okfn.org
>>> >> https://lists.okfn.org/mailman/listinfo/gastosabertos
>>> > _______________________________________________
>>> > Gastosabertos mailing list
>>> > Gastosabertos em lists.okfn.org
>>> > https://lists.okfn.org/mailman/listinfo/gastosabertos
>>> 
>>> _______________________________________________
>>> Gastosabertos mailing list
>>> Gastosabertos em lists.okfn.org
>>> https://lists.okfn.org/mailman/listinfo/gastosabertos
>> _______________________________________________
>> Gastosabertos mailing list
>> Gastosabertos em lists.okfn.org
>> https://lists.okfn.org/mailman/listinfo/gastosabertos
> _______________________________________________
> Gastosabertos mailing list
> Gastosabertos em lists.okfn.org
> https://lists.okfn.org/mailman/listinfo/gastosabertos



Mais detalhes sobre a lista de discussão Gastosabertos