[okfn-br] Maturidade em Dados Abertos: Entenda as 5 Estrelas

Leandro Salvador leandrosalvador em gmail.com
Domingo Janeiro 27 00:27:58 UTC 2013


Olá Pessoal!

Ficou muito legal esse desenvolvimento!!! =)

Sobre o PDF ser ou não um formato legível por máquina, parece-me que o
Alexandre mata a charada quando dá a ideia de diferenciarmos os conceitos.
O conceito de padronização <http://pt.wikipedia.org/wiki/Padrão_aberto> /
normatização <http://pt.wikipedia.org/wiki/Norma_técnica> /
standardization<http://en.wikipedia.org/wiki/Open_standard>(
RFC <http://pt.wikipedia.org/wiki/Request_for_Comments>,
ISO<http://pt.wikipedia.org/wiki/ISO>,
ABNT <http://pt.wikipedia.org/wiki/ABNT>, etc.) não se confunde com o
de "*formato
dos dados*" (mas talvez confunda-se com o conceito de "*formato do arquivo*"
:/). Afinal, todo e qualquer formato de arquivo eletrônico é, por óbvio,
"acessável/acessível" por softwares. Existiria algum formato de arquivo
eletrônico não acessível por máquina? :) Estar conforme um "padrão aberto"
torna o

Um PDF (ISO 32000 <http://en.wikipedia.org/wiki/ISO_32000-1>), um JPG, um
XLS, um arquivo criptografado, um arquivo corrompido: todos são acessíveis
por máquina... mas daí à "máquina" conseguir lê-lo, compreender o
significado (e a estrutura!) dos dados contidos em seu interior, é outra
história, e apenas argumentadores bobalhões ou cínicos insistirão que PDF é
um "formato de dado*s* aberto*s*". Aberto é o formato (enquanto estrutura)
dos dados, não o formato (enquanto padrão) do arquivo, portanto, não se
confundem!

Numa analogia tosca: uma pessoa que não conhece cirílico, pode até pegar
nas mãos, abrir, e percorrer com os olhos as páginas de um livro escrito em
russo (consegue acessá-lo), mas não será capaz de lê-lo (não é legível para
o leitor de livros).

Talvez nossa disputa no futuro esteja no conceito de
*legibilidade*<http://pt.wikipedia.org/wiki/Legibilidade>.
Se/quando surgirem argumentos cínico-bobalhões de que PDF e JPG são
arquivos cujos dados estruturados são legíveis por máquina, caberá a quem
milita pela abertura de dados diferenciar os conceitos (aliás, quem sabe já
começamos isso em algum verbete da Wikipédia? :). Um bom começo de
argumentação parece-me ser algo no seguinte sentido: se o PDF é um (tipo
de) arquivo legível por máquina, então *qual não é*?; se todos os (tipos
de) arquivo eletrônicos são legíveis por máquina, então o conceito aqui
aplicado de legibilidade é inútil enquanto conceito, pois não diferencia
nada de coisa alguma, e conceitos que não ajudam a diferenciar as coisas em
um determinado universo são, simplesmente, desprovidos de sentido e mesmo
inúteis.

Legibilidade de dados estruturados não deve ser confundido com
acessibilidade aos dados que compõe um arquivo. Qualquer arquivo eletrônico
é acessível por máquina, independentemente de em seu interior haver ou não
dados estruturados, bagunçados, aleatórios, criptografados.

Enfim, acho que podemos sofisticar bem nossos argumentos para fortalecer os
sentidos corretos dos conceitos, e não partir da lambança conceitual que
alguns órgãos governamentais estão fazendo por aí como algo dado. Já temos
um ponto-de-partida<http://www.planalto.gov.br/ccivil_03/_ato2011-2014/2011/lei/l12527.htm>,
ainda que frágil (a meu ver, frágil porque está num "tópico" da LAI que se
refere à transparência ativa, não à passiva):

" II - possibilitar a gravação de relatórios em diversos formatos
eletrônicos, inclusive abertos e não proprietários, tais como planilhas e
texto, de modo a facilitar a análise das informações;
[--> PDF não é texto, nem tampouco é planilha... mas fala-se aqui apenas da
gravação de relatórios, não da transparência passiva :/]

III - possibilitar o acesso automatizado por sistemas externos em formatos
abertos, estruturados e legíveis por máquina;
[--> PDF não é um formato estruturado, e as qualidades de "abertura" e de
"legibilidade", aqui, estão em debate... mas novamente, de modo limitante,
fala-se aqui apenas do acesso automatizado, não da transparência passiva :/]

IV - divulgar em detalhes os formatos utilizados para estruturação da
informação;
[--> parece-me que aqui está nossa deixa: formato utilizado para
estruturação da informação contida num PDF não se confunde com a norma ISO
que especifica o arquivo em formato PDF; fala-se aqui, em outras palavras,
do dicionário de dados (algo como o nome das colunas de uma planilha) :)] "

My 2 cents...
Abraços!

PS: DiRaOL, só pra reforçar: ficou muuuito bom! =D
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://lists.okfn.org/pipermail/okfn-br/attachments/20130126/6b1387f1/attachment-0003.html>


Mais detalhes sobre a lista de discussão okfn-br