[okfn-br] OCR Legislativo - Novo projeto OKFN Br

Pedro Markun pedro em esfera.mobi
Sexta Março 2 13:18:24 UTC 2012


Oi Tom,

roger that, vou tentar produzir essa documentação mais consistente hoje e
ir dando feedbacks por aqui ao longo do percurso.

Por enquanto eu tenho um sistema funcionando mal e porcamente baseado
naquele velho código do datadigitizer:

https://gitorious.org/ocr-no-legislativo/ocr-no-legislativo

O PyBossa já esta rodando aqui, vou tentar readaptar pra rodar nele.

Devo chamar também na semana que vem uma oficina/roda de discussão pra
apresentar e testar um pouco o tesseract e o OCRopus.

abs,
Pedro Markun

2012/3/2 Everton Zanella Alvarenga <everton.alvarenga em okfn.org>

> Pedro,
>
> que legal que vem tocando isso! Também havia conversado com o Rufus
> sobre o projeto Textus (que já mencionei aqui na lista). Acho
> fantástica a idéia de colocar o PyBossa no meio! Combinei com o Nigini
> de escrevermos um post no blog da Open Knowledge Foundation Brasil
> explicando didaticamente o que é o PyBossa e como as pessoas podem
> contribuir com seus desenvolvimento.
>
> Vou depois dar uma atualizada sobre essa lista que divulgou e acho que
> talvez você possa ajudar a melhorar essa página aqui
>
> http://wiki.okfn.org/Projects/Textus/pt
>
> Estava junto com o Rufus falando algo nessa linha e esboçamos algumas
> coisas nesse pad
>
> http://okfnpad.org/scratchpad
>
> para depois submetermos no ideas.okfn.org. Você poderia colocar
> algumas dessas idéias on pad ou wiki acima? Valeu!
>
> Tom
>
> 2012/3/1 Pedro Markun <pedro em esfera.mobi>:
> > Caros,
> >
> > tenho conversado um pouco sobre isso nas listas internacionais da OKFN,
> mais
> > especificamente na humanities-dev em lists.okfn.org pra quem quiser ir
> atrás do
> > histórico... sobre usar OCR + Crowdsourcing pra digitalizar grandes
> grupos
> > de texto.
> >
> > Tem rolado bastante discussão e já tem algum acumulo de experimentos ao
> > longo desse tempo - tem alguma coisa compilada no pad, mas vou tentar
> > documentar no wiki e centralizar as infos em seguida.
> >
> > Mas acho que era legal botar a mão na massa, então vou começar a tocar
> por
> > aqui um projeto para testar o combo:
> > OCR + Textus + PyBossa pra criar um framework de transcrição de
> documentos e
> > vou usar como set inicial os discursos históricos publicados no diário
> > oficial entre 66 e 68 - já que isso tem uma aplicação prática para o
> livro
> > que meu pai esta escrevendo e pra alguns apps daa THacker.
> >
> > Só dando um alô, pra quem estiver interessado em colaborar... chegar
> junto.
> > Mas por enquanto acho que da pra gente ir reportando progressos e updates
> > aqui pela lista mesmo, então todo mundo vai ficar no loop.
> >
> > abs,
> > Pedro Markun
>
>
>
> --
> Everton Zanella Alvarenga (also Tom)
> Open Knowledge Foundation Brasil
>
> _______________________________________________
> okfn-br mailing list
> okfn-br em lists.okfn.org
> http://lists.okfn.org/mailman/listinfo/okfn-br
>
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://lists.okfn.org/pipermail/okfn-br/attachments/20120302/42ef9eb9/attachment-0003.html>


Mais detalhes sobre a lista de discussão okfn-br