[Gastosabertos] Interface para navegar e discutir os Contratos

Edgar Zanella Alvarenga e em vaz.io
Quarta Maio 13 21:31:11 UTC 2015


Data de Publicação:  31/12/2014
Data de Assinatura:  13/5/2014

On 13/05/2015 18:13, Andres MRM wrote:
> Tá... Hum... Você tem alguma data relacionada a ele além do ano?
> Porque o ano de 2014 (supondo que ele teria sido mesmo publicado em 
> 2014) deve
> ter alguns milhares de PDFs.... =P
> A não ser que eu converta todos (uns 2Gb) com o pdftotext e dê um 
> grep.......
> 
> 
> Quoting Edgar Zanella Alvarenga (2015-05-13 17:52:18)
>> Exemplo de contrato anexado. Esse é um exemplo onde foi retirado
>> informações
>> como CPG e RG das pessoas citadas no contrato.
>> 
>> E.
>> 
>> On 13/05/2015 13:34, Andres MRM wrote:
>> > De que doc exatamente você está falando?
>> > A base "bruta" que eles nos passam está aqui:
>> > http://devcolab.each.usp.br/do/baixar
>> > Dentro do 7z do ano, deve haver um ZIP por dia.
>> > Acho mais fácil você baixar um 7z e ver se há um contrato dentro. Ou
>> > então me
>> > passa um contratado do ano passado ou desse e eu tento achar a partir
>> > da data.
>> >
>> >
>> > Quoting Edgar Zanella Alvarenga (2015-05-13 13:11:59)
>> >> Passa pra mim um desses docs por favor, só pra conferir se está no
>> >> acervo de contratos que baixei.
>> >>
>> >> E.
>> >>
>> >> On 13/05/2015 13:10, Andres MRM wrote:
>> >> > Hummm... Bom, então talvez estejam nos PDFs que nós recebemos,
>> >> > disponibilizamos como dados brutos, mas não indexamos... =/
>> >> >
>> >> >
>> >> > Quoting Edgar Zanella Alvarenga (2015-05-13 12:39:02)
>> >> >> Aquilo era um aditivo de contrato pelo que entendi. Os contratos em
>> >> >> geral
>> >> >> são PDF's, documentos do Word ou arquivos escaneados.
>> >> >>
>> >> >> E.
>> >> >>
>> >> >> On 13/05/2015 12:32, Andres MRM wrote:
>> >> >> >> Não achei os contratos no Diário Livre, onde estão?
>> >> >> >
>> >> >> > **Acho** que são os artigos marcados como "licitações" no DL. Pelo
>> >> >> > menos o
>> >> >> > contrato que você mandou aqui para a lista estava lá assim.
>> >> >> >
>> >> >> >> Mas a parte que acho que foge do Diário Livre, pelo menos no modelo
>> >> >> >> atual dele é a questão de integrar um sistema de colaboração na
>> >> >> >> interface.
>> >> >> >>
>> >> >> >> Só fornecer os dados brutos é importante, numa interface fácil de
>> >> >> >> navegação
>> >> >> >> como o Diário Livre faz melhor ainda. Mas tenho curiosidade em qual
>> >> >> >> rumo
>> >> >> >> tomaria um projeto em que o foco fosse esse, trabalho colaborativo em
>> >> >> >> cima
>> >> >> >> dos documentos da forma mais trivial possível. Por isso um thread de
>> >> >> >> discussão,
>> >> >> >> sistema binário de votos (Bom x Problemático "falta info", "não foi
>> >> >> >> feito",
>> >> >> >> etc)
>> >> >> >> e a única parte mais elaborada seria a  extração de dados como
>> >> >> >> "quantidade"
>> >> >> >> (kg
>> >> >> >> de bananas) e "valor" (10.000kg).
>> >> >> >
>> >> >> > É, dai eu também não tenho claro como seria essa integração...
>> >> >> >
>> >> >> >
>> >> >> >
>> >> >> > Quoting Paula Oda (2015-05-13 11:13:26)
>> >> >> >> Edgar,
>> >> >> >>
>> >> >> >> Acho bem legal a proposta.
>> >> >> >> A criação de uma página simples, como voce sugeriu inicialmente, pode
>> >> >> >> ajudar a
>> >> >> >> formar um grupo em torno dessa discussão e dai progredimos um pouco na
>> >> >> >> questão
>> >> >> >> do contexto de comunidade e direcionar as iniciativas que tomaríamos
>> >> >> >> neste
>> >> >> >> tópico. E o trabalho colaborativo entra bastante nessa vertente, acho
>> >> >> >> que da
>> >> >> >> pra pensar nisso com mais calma.
>> >> >> >>
>> >> >> >> A vantagem da interação com o Diário Livre é inclusive aproveitar os
>> >> >> >> usuários/
>> >> >> >> pesquisadores dessas informações. Acho válido.
>> >> >> >> Nessa mesma linha, tem o email que o Tom mandou para conversarmos com
>> >> >> >> a
>> >> >> >> Fernanda e com a própria Gisele....
>> >> >> >>
>> >> >> >> Acho que tem muita ideia pra organizar com isso!
>> >> >> >>
>> >> >> >> De forma mais pragmática....não podemos esquecer de levantar quanta
>> >> >> >> dedicação e
>> >> >> >> desenvolvimento seria necessário para essa proposta inicial, ainda
>> >> >> >> mais nesse
>> >> >> >> momento que estamos de reestruturação do projeto!
>> >> >> >>
>> >> >> >> Só peço um pouquinho de calma para conseguirmos organizar as coisas
>> >> >> >> antes de
>> >> >> >> sairmos fazendo (mas fiquem a vontade para continuar discutindo o
>> >> >> >> assunto
>> >> >> >> rs).... ;)
>> >> >> >> Ainda estou organizando as ideias, vendo o que vocês já levantaram e
>> >> >> >> etc
>> >> >> >>
>> >> >> >> Paula Oda
>> >> >> >>
>> >> >> >> 2015-05-13 10:33 GMT-03:00 Edgar Zanella Alvarenga <e em vaz.io>:
>> >> >> >>
>> >> >> >>     Não achei os contratos no Diário Livre, onde estão?
>> >> >> >>
>> >> >> >>     Quanto a busca textual, sim, seria uma boa e minha idéia seria o
>> >> >> >> Solr.
>> >> >> >>
>> >> >> >>     Mas a parte que acho que foge do Diário Livre, pelo menos no
>> >> >> >> modelo
>> >> >> >>     atual dele é a questão de integrar um sistema de colaboração na
>> >> >> >> interface.
>> >> >> >>
>> >> >> >>     Só fornecer os dados brutos é importante, numa interface fácil de
>> >> >> >> navegação
>> >> >> >>     como o Diário Livre faz melhor ainda. Mas tenho curiosidade em
>> >> >> >> qual rumo
>> >> >> >>     tomaria um projeto em que o foco fosse esse, trabalho colaborativo
>> >> >> >> em cima
>> >> >> >>     dos documentos da forma mais trivial possível. Por isso um thread
>> >> >> >> de
>> >> >> >>     discussão,
>> >> >> >>     sistema binário de votos (Bom x Problemático "falta info", "não
>> >> >> >> foi feito",
>> >> >> >>     etc)
>> >> >> >>     e a única parte mais elaborada seria a  extração de dados como
>> >> >> >> "quantidade"
>> >> >> >>     (kg
>> >> >> >>     de bananas) e "valor" (10.000kg).
>> >> >> >>
>> >> >> >>     Mas acho que seria legal uma integração com o Diário Livre, por
>> >> >> >> exemplo,
>> >> >> >>     na página de uma licitação possuir um link pro arquivo do
>> >> >> >> contrato.
>> >> >> >>
>> >> >> >>     E.
>> >> >> >>
>> >> >> >>
>> >> >> >>     On 13/05/2015 08:23, Andres MRM wrote:
>> >> >> >>
>> >> >> >>         Talvez fosse legal integrar com o Diário Livre, já que os
>> >> >> >> contratos
>> >> >> >>         parecem
>> >> >> >>         estar lá também. Só não sei como seria isso...
>> >> >> >>
>> >> >> >>         Bom, acho que na pior das hipóteses podemos tentar unir
>> >> >> >> através de URLs
>> >> >> >>         únicos
>> >> >> >>         para os contratos em cada sistema...
>> >> >> >>         Peter, o LexML cobre contratos?
>> >> >> >>
>> >> >> >>         Acho que seria bom permitir busca no texto dos contratos, não?
>> >> >> >> Você
>> >> >> >>         disse que
>> >> >> >>         são vários Gb? Já sabe o que vai usar para isso? O DL usa Solr
>> >> >> >> com uma
>> >> >> >>         interface de BlackLight.
>> >> >> >>
>> >> >> >>
>> >> >> >>         Quoting Everton Zanella Alvarenga (2015-05-13 01:34:17)
>> >> >> >>
>> >> >> >>             Sim, esse é o caminho. Acho ótimo. Mas temos que desenhar
>> >> >> >>             direitinho a
>> >> >> >>             interface para ser simples e haver participação de mais
>> >> >> >> pessoas
>> >> >> >>             (entendendo o
>> >> >> >>             que estão fazendo, hehe).
>> >> >> >>
>> >> >> >>             O Hypothesis <https://hypothes.is/> pode colocar tag e
>> >> >> >> responder um
>> >> >> >>             comentário.
>> >> >> >>             Por que não acha que é suficiente? Se falta alguma
>> >> >> >> característica,
>> >> >> >>             não seria
>> >> >> >>             legal fazer em cima dele?
>> >> >> >>
>> >> >> >>             E se formar uma comunidade, os contratos mal formatados
>> >> >> >> não terão
>> >> >> >>             que passar
>> >> >> >>             por um crowsourcing para extrairmos os metadados? Por isso
>> >> >> >> falei do
>> >> >> >>             Crowd
>> >> >> >>             Crafting <http://crowdcrafting.org/>, que usa o PyBossa.
>> >> >> >>
>> >> >> >>
>> >> >> >>             Em 13 de maio de 2015 01:11, Edgar Zanella Alvarenga
>> >> >> >> <e em vaz.io>
>> >> >> >>             escreveu:
>> >> >> >>
>> >> >> >>                 Uma primeira proposta de desenvolvimento em cima dos
>> >> >> >> dados de
>> >> >> >>             contrato
>> >> >> >>                 seria criarmos uma simples página onde pudesse navegar
>> >> >> >> de forma
>> >> >> >>             mais
>> >> >> >>                 eficiente pelos contratos. Com paginação funcional,
>> >> >> >> busca e o
>> >> >> >>             mais
>> >> >> >>                 importante:
>> >> >> >>                 possibilidade de comentários externos e uma edição
>> >> >> >> colaborativa
>> >> >> >>             de dados
>> >> >> >>                 como valores dos contratos, assim qualquer um poderia
>> >> >> >> editar os
>> >> >> >>             valores
>> >> >> >>                 errados. O que acham?
>> >> >> >>
>> >> >> >>                 Seria legal se a cada contrato estivesse associado uma
>> >> >> >>             discussão, estilo
>> >> >> >>                 um fórum. Daí os contratos com mais comentários, mais
>> >> >> >>             movimentação poderia
>> >> >> >>                 naturalmente subir no topo de uma lista dos contratos
>> >> >> >> mais
>> >> >> >>             polêmicos.
>> >> >> >>
>> >> >> >>                 Desse modo estaríamos dando um ótimo exemplo de uso
>> >> >> >> onde a
>> >> >> >>             população
>> >> >> >>                 poderia
>> >> >> >>                 participar de forma ativa na análise e discussão em
>> >> >> >> cima da
>> >> >> >>             execução
>> >> >> >>                 orçamentária. E seria um ótimo exemplo de crowd
>> >> >> >> sourcing ao
>> >> >> >>             invés de
>> >> >> >>                 centralizarmos o trabalho somente no grupo do Gastos
>> >> >> >> Abertos e
>> >> >> >>             dos nossos
>> >> >> >>                 parceiros. Sim, vamos ter bastante coisas para fazer,
>> >> >> >> mas quem
>> >> >> >>             sabe quais
>> >> >> >>                 tipos de contribuição teremos se deixarmos um site
>> >> >> >> simples e de
>> >> >> >>             fácil
>> >> >> >>                 colaboração?
>> >> >> >>
>> >> >> >>                 O que acham?
>> >> >> >>                 Edgar
>> >> >> >>                 _______________________________________________
>> >> >> >>                 Gastosabertos mailing list
>> >> >> >>                 Gastosabertos em lists.okfn.org
>> >> >> >>                 https://lists.okfn.org/mailman/listinfo/gastosabertos
>> >> >> >>
>> >> >> >>
>> >> >> >>
>> >> >> >>
>> >> >> >>             --
>> >> >> >>             Everton Zanella Alvarenga (also Tom)
>> >> >> >>             Open Knowledge Brasil - Rede pelo Conhecimento Livre
>> >> >> >>             http://br.okfn.org
>> >> >> >>
>> >> >> >>         _______________________________________________
>> >> >> >>         Gastosabertos mailing list
>> >> >> >>         Gastosabertos em lists.okfn.org
>> >> >> >>         https://lists.okfn.org/mailman/listinfo/gastosabertos
>> >> >> >>
>> >> >> >>     _______________________________________________
>> >> >> >>     Gastosabertos mailing list
>> >> >> >>     Gastosabertos em lists.okfn.org
>> >> >> >>     https://lists.okfn.org/mailman/listinfo/gastosabertos
>> >> >> >>
>> >> >> >>
>> >> >> >>
>> >> >> >>
>> >> >> >> --
>> >> >> >> Paula Oda
>> >> >> > _______________________________________________
>> >> >> > Gastosabertos mailing list
>> >> >> > Gastosabertos em lists.okfn.org
>> >> >> > https://lists.okfn.org/mailman/listinfo/gastosabertos
>> >> >> _______________________________________________
>> >> >> Gastosabertos mailing list
>> >> >> Gastosabertos em lists.okfn.org
>> >> >> https://lists.okfn.org/mailman/listinfo/gastosabertos
>> >> > _______________________________________________
>> >> > Gastosabertos mailing list
>> >> > Gastosabertos em lists.okfn.org
>> >> > https://lists.okfn.org/mailman/listinfo/gastosabertos
>> >> _______________________________________________
>> >> Gastosabertos mailing list
>> >> Gastosabertos em lists.okfn.org
>> >> https://lists.okfn.org/mailman/listinfo/gastosabertos
>> > _______________________________________________
>> > Gastosabertos mailing list
>> > Gastosabertos em lists.okfn.org
>> > https://lists.okfn.org/mailman/listinfo/gastosabertos
>> 
>> _______________________________________________
>> Gastosabertos mailing list
>> Gastosabertos em lists.okfn.org
>> https://lists.okfn.org/mailman/listinfo/gastosabertos
> _______________________________________________
> Gastosabertos mailing list
> Gastosabertos em lists.okfn.org
> https://lists.okfn.org/mailman/listinfo/gastosabertos



Mais detalhes sobre a lista de discussão Gastosabertos