[ciência aberta]Librelattes - vamos fazer engenharia reversa da base do Lattes?

Antonio Terceiro terceiro em softwarelivre.org
Sexta Maio 22 17:49:54 UTC 2015


On Fri, May 22, 2015 at 01:33:32PM -0300, Arthur Del Esposte wrote:
> Olá,
> 
> Vou aproveitar a thread pra me apresentar também, já que ainda não o fiz ;)
> Sou Arthur Del Esposte, Eng. de Software e tenho interesse nas discussões
> sobre Ciência Aberta, principalmente no que tange as questões do Lattes e é
> a primeira vez que posto na lista!
> 
> Alguém sabe o status atual do scriptlattes depois que o CNPQ também colocou
> captcha para visualizar currículos?
> 
> Ou seja, cada dia é mais difícil extrair os dados do lattes sem intervenção
> das pessoas. Então, acho que a proposta de Terceiro pode ser um bom passo
> para ter uma base alternativa que, consequentemente, é o passo fundamental
> para realizar as demais coisas.

o scriptLattes continua firme e forma, na verdade vencer o captcha do
lattes é mais simples do que parece:
https://bitbucket.org/scriptlattes/scriptlattes/src/ea59dd790fdb7b8d49fae85155c7ebb3db5fcc77/scriptLattes/baixaLattes.py?at=master#cl-64

(mas não espalhe ... vai que eles resolvem fazer um captcha decente ;-))

eu inclusive testei e o mesmo método funciona pra baixar o currículo em
XML, de forma que em teoria seria possível baixar a base toda ...

-- 
Antonio Terceiro <terceiro em softwarelivre.org>
http://softwarelivre.org/terceiro


-------------- Próxima Parte ----------
Um anexo não-texto foi limpo...
Nome: signature.asc
Tipo: application/pgp-signature
Tamanho: 819 bytes
Descrição: Digital signature
URL: <http://lists.okfn.org/pipermail/cienciaaberta/attachments/20150522/fbf43faa/attachment-0003.sig>


Mais detalhes sobre a lista de discussão cienciaaberta