[okfn-br] Maturidade em Dados Abertos: Entenda as 5 Estrelas

Luis Capelo luiscape em gmail.com
Sábado Janeiro 19 13:38:22 UTC 2013


Muito relevante à discussão: CAPES alega que liberar seus dados em PDF é
cumprir com os requerimentos de “dados abertos”: http://retps.org.br/?p=179

// Luis Capelo

 *From:* Guilherme Januário
*Sent:* ‎January‎ ‎18‎, ‎2013 ‎6‎:‎05‎ ‎PM
*To:* Grupo de interesse em conhecimento livre no Brasil, especialmente
dados abertos
*Subject:* Re: [okfn-br] Maturidade em Dados Abertos: Entenda as 5 Estrelas

Um CSV é muito mais fácil de se gerar que um PDF, comumente.

O caso (2) abaixo mostra um exemplo em que gerar o CSV pode ser complicado,
sendo um processo cuja facilidade é altamente dependente dos 'fornecedores'
(vendedores de máquinas de leitura ótica, no exemplo)

Creio que um CSV demoraria tanto mais que um PDF apenas num caso em que os
dados que haveriam sido utilizados na geração do PDF, bem como o arquivo
intermediário do qual o PDF teria sido produzido, estão perdidos.

Claro que estou lidando aqui com dados tabulares.

Seguem exemplos de interação entre confecção de CSV e PDF:

1) Um caso em que CSV pode ser difícil de se obter.

Um caso no qual a geração de um CSV seria complicada é: os dados iniciais,
rudimentares, estão perdidos e apenas dispõe-se de um arquivo no formato
Latex, a partir do qual o PDF fora gerado. Converter para CSV o conteúdo
dum arquivo cuja tabela é formatada em Latex talvez não seja tão trivial.


2) Outro caso em que CSV pode ser difícil de se obter.

O PDF fora gerado a partir de dados já trabalhados (digamos, a partir de um
.DOC ou dum .ODS), ou seja, a partir dum arquivo intermediário e, ainda que
os dados rudimentares persistam num arquivo qualquer, perdeu-se o arquivo
intermediário. Nessa situação, trabalhar os dados rudimentares pode ser o
que tome tempo.


3) Exemplo prático dum caso do item (1).

No caso da Fuvest, caso seja utilizada uma máquina de leitura ótica que
gere PDF apenas, obter um CSV sobre as respostas de cada candidato pode ser
complicado. Entretando, a Fuvest certamente não utiliza uma leitora ótica
para saber quantos alunos ingressaram num determinado curso...



Desculpe a prolixidade.






Em 18 de janeiro de 2013 16:31, Nitai Silva <nitaibezerra em gmail.com>escreveu:

Respondi lá gente...


Tá esquentando… :P

Gente, depois da mensagem do Jorge eu adicionei que só pode chamado de
dados abertos quando são 3 estrelas.

Yaso, a penúltima frase “sonhe com o RDF…” responde um pouco do seu alerta.

A mensagem que quero deixar nesse post é que pra quem quer abrir dados dá
pra fazer uma estratégia incremental, reduzindo as resistências.

Concordo que entre o CSV e o RDF existe uma distância enorme de qualidade.
Mas será que devemos transmitir a mensagem de que CSV é insuficiente? A
mesma pergunta pro PDF. É preferível esperar 2 meses por um arquivo CSV que
ter um PDF agora e um CSV daqui a 2 meses?
[]s
Nitai

On Friday, January 18, 2013, Haydee Svab wrote:

Concordo com o Jorge e com o Abdo.
Vou além inclusive: formato proprietário não é dado aberto, visto que tem a
prerrogativa de que quem quer acessar um xls, por exemplo, deve ter
condição financeira para adquirir o Excel.
Assim, eu só começaria a olhar como Dado Aberto das 3 estrelas em diante...
Entendo que a ideia é apontar o caminho, mas dar destaque ao pdf (que é o
inferno para que deseja trabalhar com dados) e a formatos proprietários, é
valorizar essa possibilidade, num país em que muitas vezes se faz apenas o
mínimo.

E Jorge, tb acho que vale um post!

Abraços,

-- 
Haydée Svab
http://blog.hsvab.eng.br/


_______________________________________________
okfn-br mailing list
okfn-br em lists.okfn.org
http://lists.okfn.org/mailman/listinfo/okfn-br
Unsubscribe: http://lists.okfn.org/mailman/options/okfn-br




-- 
Atenciosa e agradecidamente,
Guilherme C. Januário.

_______________________________________________
okfn-br mailing list
okfn-br em lists.okfn.org
http://lists.okfn.org/mailman/listinfo/okfn-br
Unsubscribe: http://lists.okfn.org/mailman/options/okfn-br
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://lists.okfn.org/pipermail/okfn-br/attachments/20130119/f98a8581/attachment-0003.html>


Mais detalhes sobre a lista de discussão okfn-br