[okfn-br] dados abertos burilados, num PDF!?...

Raniere Silva raniere em riseup.net
Quarta Abril 29 13:51:12 UTC 2015


Olá Peter,

por simplicidade, podemos dividir todo material escrito em dois tipos:
(1) "texto" --- e.g. wiki, atas, artigos científicos --- e
(2) "infográfico" --- e.g. revistas, posters.

> Consulte o mercado (!) de revistas, de livros, etc. Quantos por cento do
> mercado editorial usam alguma das ferramentas que você cita
> (Pandoc, LaTex, até MS-Word e cia) para gerar produtos profissionais?

O "mercado" basicamente produz material do tipo "infográfico".
Nesse tipo de material você se importa bastante com a posição de cada elemento
e por isso você vai precisar utilizar uma ferramenta que lhe permita
"fixar" os elementos em uma posição.

Para essa caso o Pandoc não é a melhor solução.
Ele segue a filosofia UNIX de fazer apenas uma única tarefa,
que nesse caso é converter de uma linguagem de marcação para outra,
e.g. de HTML para DOCX.

LaTeX e MS-Word são capazes de gerar produtos profissionais!!!
Porque o mercado não usa?
No caso de LaTeX, porque o número de usuários é muito pequeno
e posicionar elementos é extremamente difícil.
No caso de MS-Word, porque filtrar o joio do trigo demandaria muito esforço.

> Pandoc não tem capacidade de gerar produto profissional, CSS2-page (e no
> futuro CSS3) tem.

Se você utilizar o Pandoc para converter para HTML
você estará utilizando CSS2-page e CSS3. 
Então, Pandoc tem capacidade de gerar produto profissional.
>
> O mercado editorial do Brasil usa, em 80% ou mais dos casos, o *Adobe
> InDesign* (e pirata),
> e o InDesign é muito ruim para trabalhar com softwares de geração
> automática de conteúdo, alem de não ser software aberto.
> Softwares como InDesign não permitem por exemplo o uso em cadeia produtiva,
> num esquema p.ex. de XML-Publishing.

O InDesign foi feito para trabalhar com "infográfico".
XML-Publishing basicamente está trabalhando com "texto".

> Notadamente os Diários Oficiais dos 5570 municípios brasileiros são caros
> (temos pago caro por isso!) por passarem por todo esse processo
> artesanal... quando não precisariam.

Você sabe onde encontro o valor gasto com o Diário Oficial?

> Desde as revistas das bancas, até revistas científicas da USP, relatórios
> da UNESCO e panfletos da Cocacola, é tudo InDesign... E o público desses
> PDFs é refratário a "diagramação ruim" (!), não dá para "quebrar o galho"
> com Pandoc.

Isso é um problema de transição tecnológica.
Eu tenho esse problema com a minha mãe que quando jovem fez curso de
datilografia e uso por muito tempo máquina de escrever.
Não adianta eu explicar para ela que o LibreOffice Writer é capaz de atribuir
estilo aos parágrafos e assim controlar o espaçamento entre eles.
Ela vai colocar um parágrafo vazio entre os parágrafos
e alterar manualmente a fonte desses parágrafos vazios
para obter um espaçamento duplo.

A mesma coisa acontece no ramo editorial.
Grande parte das pessoas que trabalham hoje ainda utilizaram a máquina de escrever
e vão fazer as coisas como se estivessem utilizando uma máquina de escrever.
Eu e você vamos precisar esperar essas pessoas se aposentarem,
torcer para que os vícios delas não sejam passados para as novas gerações
e incentivar os mais novos a adotarem os padrões que queremos, e.g. CSS3.

Raniere
-------------- Próxima Parte ----------
Um anexo não-texto foi limpo...
Nome: signature.asc
Tipo: application/pgp-signature
Tamanho: 819 bytes
Descrição: Digital signature
URL: <http://lists.okfn.org/pipermail/okfn-br/attachments/20150429/cbff1476/attachment-0005.sig>


Mais detalhes sobre a lista de discussão okfn-br