[okfn-br] dados abertos burilados, num PDF!?...
Peter Krauss
ppkrauss em gmail.com
Quarta Abril 29 14:50:42 UTC 2015
Em 29 de abril de 2015 10:51, Raniere Silva <raniere em riseup.net> escreveu:
> Olá Peter,
>
> por simplicidade, podemos dividir todo material escrito em dois tipos:
> (1) "texto" --- e.g. wiki, atas, artigos científicos --- e
> (2) "infográfico" --- e.g. revistas, posters.
>
Acho que, pelos exemplos que deu, pode parecer equivocado, agregou demais o
tipo 1...
que acrescentar tal mais um tipo intermediário?
(1) "texto" --- e.g. wiki, atas, diário oficial feio
*(2)* "artigo" -- de revista normal, revista científica, de diário oficial
sério e bonito,
(3) "infográfico" -- revistas de moda, posters, conteúdos de arte e
arquitetura,
é no item 2 (de 3) que se concentra o mercado (!), e que você havia
agregado com coisas mais simples e sem valor de mercado.
>
> > Consulte o mercado (!) de revistas, de livros, etc. Quantos por cento do
> > mercado editorial usam alguma das ferramentas que você cita
> > (Pandoc, LaTex, até MS-Word e cia) para gerar produtos profissionais?
>
> O "mercado" basicamente produz material do tipo "infográfico".
>
redefinindo, produz "artigo"
> Nesse tipo de material você se importa bastante com a posição de cada
> elemento
> e por isso você vai precisar utilizar uma ferramenta que lhe permita
> "fixar" os elementos em uma posição.
>
cuidado, há que se quebrar essa afirmação:
* o que distingue o (1), "texto", do (2), "artigo", é essa coisa de
"posição de cada elemento" no *TEMPLATE*.
Quando o *template* é mais sofisticado, temos item 2.
* o que distingue o (2), "artigo", do (3), "infografico", é essa coisa de
"posição de cada elemento" na diagramação final.
Quanto mais cricri e personalizada a diagramação final, mais
"infográfico" é o produto final.
>
> Para essa caso o Pandoc não é a melhor solução.
> Ele segue a filosofia UNIX de fazer apenas uma única tarefa,
> que nesse caso é converter de uma linguagem de marcação para outra,
> e.g. de HTML para DOCX.
>
> LaTeX e MS-Word são capazes de gerar produtos profissionais!!!
>
Apesar do MS-Word ter evoluído, em geral não se deve comparar o PDF gerado
por MS-Word com o PDF gerado por LaTeX, muito menos gerado InDesign.
Para os casos (2) e (3), procure e converse com um "piloto de InDesign" que
ganha a vida com isso!
> Porque o mercado não usa?
> No caso de LaTeX, porque o número de usuários é muito pequeno
> e posicionar elementos é extremamente difícil.
>
Isso, LaTeX não se presta a fazer item (3), "infográfico", mas se presta ao
item (2)!
Mas LaTeX é uma lástima, perdeu o trem da história, decidiu manter-se como
padrão isolado do ecosistema XML e CSS...
Existem ferramentas com exatamente a mesma filosofia de trabalho que LaTeX,
como o PrinceXML, mas que cumprem com todos os padrões abertos, incluindo
XML, HTML e CSS (2 e 3!).
No mercado de recursos humanos, a coisa mais barata que existe é
diagramador de HTML (o cara que refaz uma tabela com CSS no Dreamwaver por
exemplo) ... Contratar um expert em LaTeX é impossível, um expert em
InDesign o triplo do preço...
O super-expert em MS-Word consegue alguns resultados, mas nunca se
aproximam do item (3), "Infográfico", ficam sempre mais próximos do item
(1), "texto".
> No caso de MS-Word, porque filtrar o joio do trigo demandaria muito
> esforço.
>
> > Pandoc não tem capacidade de gerar produto profissional, CSS2-page (e no
> > futuro CSS3) tem.
>
> Se você utilizar o Pandoc para converter para HTML
> você estará utilizando CSS2-page e CSS3.
> Então, Pandoc tem capacidade de gerar produto profissional.
>
Sim, mas tente fazer o Pandoc entender todas as propriedades do CSS, ele
ignorar (!). Assim como vai ignorar os seletores mais complexos... O dia
que o Webkit ou o Blink souberem interpretar CSS-page, o Pandoc vai
saber... Por isso citei engines na "Demanda1" do email inicial da discussão.
Apenas o Prince reconhece todas as propriedades do CSS2-page (além de boa
parte do CSS3).
> >
> > O mercado editorial do Brasil usa, em 80% ou mais dos casos, o *Adobe
> > InDesign* (e pirata),
> > e o InDesign é muito ruim para trabalhar com softwares de geração
> > automática de conteúdo, alem de não ser software aberto.
> > Softwares como InDesign não permitem por exemplo o uso em cadeia
> produtiva,
> > num esquema p.ex. de XML-Publishing.
>
> O InDesign foi feito para trabalhar com "infográfico".
>
isso, é apenas para esse caso (item 3) que vale a pena pagar horas-humano e
eventualmente uma licença.
> XML-Publishing basicamente está trabalhando com "texto".
>
>
Equivocado se não fazer o split para "artigo vs texto". O XML-Publishing
(com Prince por ex.) permite
realmente a produção de artigos (item 2) bem profissionais, comentei em
2011 que a cadeia no Brasil
já poderia ser uma realidade... Mas até hoje não vi uma empresa brasileira
séria conseguindo fazer isso,
http://www.datagramazero.org.br/out11/Ind_com.htm
> Notadamente os Diários Oficiais dos 5570 municípios brasileiros são caros
> > (temos pago caro por isso!) por passarem por todo esse processo
> > artesanal... quando não precisariam.
>
> Você sabe onde encontro o valor gasto com o Diário Oficial?
>
Ótima oportunidade para tentar explorar dados abertos (!!), tente em
http://www.ima.sp.gov.br/transparencia/contratos
acho que é da ordem de R$40mil/mês o custo de produção dos Diarios Oficiais
de Campinas (é apenas geração dos PDFs eles não distribuem impresso).
>
> > Desde as revistas das bancas, até revistas científicas da USP, relatórios
> > da UNESCO e panfletos da Cocacola, é tudo InDesign... E o público desses
> > PDFs é refratário a "diagramação ruim" (!), não dá para "quebrar o galho"
> > com Pandoc.
>
> Isso é um problema de transição tecnológica.
> Eu tenho esse problema com a minha mãe que quando jovem fez curso de
> datilografia e uso por muito tempo máquina de escrever.
> Não adianta eu explicar para ela que o LibreOffice Writer é capaz de
> atribuir
> estilo aos parágrafos e assim controlar o espaçamento entre eles.
> Ela vai colocar um parágrafo vazio entre os parágrafos
> e alterar manualmente a fonte desses parágrafos vazios
> para obter um espaçamento duplo.
>
Exato...
>
> A mesma coisa acontece no ramo editorial.
> Grande parte das pessoas que trabalham hoje ainda utilizaram a máquina de
> escrever
> e vão fazer as coisas como se estivessem utilizando uma máquina de
> escrever.
> Eu e você vamos precisar esperar essas pessoas se aposentarem,
> torcer para que os vícios delas não sejam passados para as novas gerações
> e incentivar os mais novos a adotarem os padrões que queremos, e.g. CSS3.
>
Em parte (tendo em vista o que já comentei acima), mas em parte também
concordo :-)
Peter
>
> Raniere
>
> _______________________________________________
> okfn-br mailing list
> okfn-br em lists.okfn.org
> https://lists.okfn.org/mailman/listinfo/okfn-br
> Unsubscribe: https://lists.okfn.org/mailman/options/okfn-br
>
>
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://lists.okfn.org/pipermail/okfn-br/attachments/20150429/4ce4ae2e/attachment-0005.html>
Mais detalhes sobre a lista de discussão okfn-br