[okfn-br] Maturidade em Dados Abertos: Entenda as 5 Estrelas

Guilherme Januário ixacaba em gmail.com
Sexta Janeiro 18 19:50:41 UTC 2013


Um CSV é muito mais fácil de se gerar que um PDF, comumente.

O caso (2) abaixo mostra um exemplo em que gerar o CSV pode ser complicado,
sendo um processo cuja facilidade é altamente dependente dos 'fornecedores'
(vendedores de máquinas de leitura ótica, no exemplo)

Creio que um CSV demoraria tanto mais que um PDF apenas num caso em que os
dados que haveriam sido utilizados na geração do PDF, bem como o arquivo
intermediário do qual o PDF teria sido produzido, estão perdidos.

Claro que estou lidando aqui com dados tabulares.

Seguem exemplos de interação entre confecção de CSV e PDF:

1) Um caso em que CSV pode ser difícil de se obter.

Um caso no qual a geração de um CSV seria complicada é: os dados iniciais,
rudimentares, estão perdidos e apenas dispõe-se de um arquivo no formato
Latex, a partir do qual o PDF fora gerado. Converter para CSV o conteúdo
dum arquivo cuja tabela é formatada em Latex talvez não seja tão trivial.


2) Outro caso em que CSV pode ser difícil de se obter.

O PDF fora gerado a partir de dados já trabalhados (digamos, a partir de um
.DOC ou dum .ODS), ou seja, a partir dum arquivo intermediário e, ainda que
os dados rudimentares persistam num arquivo qualquer, perdeu-se o arquivo
intermediário. Nessa situação, trabalhar os dados rudimentares pode ser o
que tome tempo.


3) Exemplo prático dum caso do item (1).

No caso da Fuvest, caso seja utilizada uma máquina de leitura ótica que
gere PDF apenas, obter um CSV sobre as respostas de cada candidato pode ser
complicado. Entretando, a Fuvest certamente não utiliza uma leitora ótica
para saber quantos alunos ingressaram num determinado curso...



Desculpe a prolixidade.






Em 18 de janeiro de 2013 16:31, Nitai Silva <nitaibezerra em gmail.com>escreveu:

> Respondi lá gente...
>
>
> Tá esquentando… :P
>
> Gente, depois da mensagem do Jorge eu adicionei que só pode chamado de
> dados abertos quando são 3 estrelas.
>
> Yaso, a penúltima frase “sonhe com o RDF…” responde um pouco do seu alerta.
>
> A mensagem que quero deixar nesse post é que pra quem quer abrir dados dá
> pra fazer uma estratégia incremental, reduzindo as resistências.
>
> Concordo que entre o CSV e o RDF existe uma distância enorme de qualidade.
> Mas será que devemos transmitir a mensagem de que CSV é insuficiente? A
> mesma pergunta pro PDF. É preferível esperar 2 meses por um arquivo CSV que
> ter um PDF agora e um CSV daqui a 2 meses?
> []s
> Nitai
>
> On Friday, January 18, 2013, Haydee Svab wrote:
>
>> Concordo com o Jorge e com o Abdo.
>> Vou além inclusive: formato proprietário não é dado aberto, visto que tem
>> a prerrogativa de que quem quer acessar um xls, por exemplo, deve ter
>> condição financeira para adquirir o Excel.
>> Assim, eu só começaria a olhar como Dado Aberto das 3 estrelas em
>> diante...
>> Entendo que a ideia é apontar o caminho, mas dar destaque ao pdf (que é o
>> inferno para que deseja trabalhar com dados) e a formatos proprietários, é
>> valorizar essa possibilidade, num país em que muitas vezes se faz apenas o
>> mínimo.
>>
>> E Jorge, tb acho que vale um post!
>>
>> Abraços,
>>
>> --
>> Haydée Svab
>> http://blog.hsvab.eng.br/
>
>
> _______________________________________________
> okfn-br mailing list
> okfn-br em lists.okfn.org
> http://lists.okfn.org/mailman/listinfo/okfn-br
> Unsubscribe: http://lists.okfn.org/mailman/options/okfn-br
>
>


-- 
Atenciosa e agradecidamente,
Guilherme C. Januário.
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://lists.okfn.org/pipermail/okfn-br/attachments/20130118/cd159be1/attachment-0004.html>


Mais detalhes sobre a lista de discussão okfn-br