[Escola de Dados] [thackday] Re: [okfn-br] Aplicativo web para "melhorar" seu texto

Gui Bueno gob.bueno em gmail.com
Domingo Abril 20 21:32:10 UTC 2014


Em português, o App não identifica advérbios e nem a voz passiva, mas
indica as frases longas demais. Isso já é BEM útil!

Quanto ao nome, acho que George Orwell merecia muito mais essa homenagem.
Já leram Politics and the English
Language<http://wikilivres.ca/wiki/Politics_and_the_English_Language>?
É um texto fantástico! Ele argumenta que a linguagem complicada mascara as
intenções políticas de quem fala ou escreve. Um bom exemplo são os textos
legislativos, como disse o Pedro Markun. Ao final, propõe 6 regras:

(i) Never use a metaphor, simile or other figure of speech which you are
> used to seeing in print.
> (ii) Never use a long word where a short one will do.
> (iii) If it is possible to cut a word out, always cut it out.
> (iv) Never use the passive where you can use the active.
> (v) Never use a foreign phrase, a scientific word or a jargon word if you
> can think of an everyday English equivalent.
> (vi) Break any of these rules sooner than say anything barbarous.
>

Gui Bueno



2014-04-12 17:43 GMT-03:00 Pedro Markun <pedro em markun.com.br>:

> Isso é um bom plugin pra texto legislativo.
>
> —— escrito no celular
> On Apr 12, 2014 5:34 PM, "Marcelo Träsel" <marcelo.trasel em gmail.com>
> wrote:
>
>> Esse app me lembra um plugin de WordPress que comparava os posts com um
>> dicionário das dez mil palavras mais usadas no inglês e sugeria retirar as
>> que não estivessem no banco de dados, para melhorar a compreensibilidade do
>> texto pelo afegão médio.
>>
>> Acho que seria útil algo assim nas redações, onde se procura ser o mais
>> compreensível possível. Por outro lado, prefiro a abordagem de tentar
>> educar o leitor. Achei legal o design do De Correspondent, que coloca
>> setinhas nas siglas e palavras complicadas. Clicando-se nelas, aparece um
>> parágrafo de definição que é fácil de colapsar depois:
>>
>>
>> https://decorrespondent.nl/393/deel-je-kliekjes-kweek-je-vlees-manipuleer-je-broccoli/35254065-518d5989
>>
>> ______________
>> marcelo träsel
>> http://www.trasel.com.br
>>
>> O que é difícil? Conhecer a si mesmo.
>> O que é fácil? Aconselhar os outros.
>>
>>                                     -- Tales de Mileto
>>
>>
>> Em 11 de abril de 2014 18:23, Marcelo Fontoura <
>> marcelocfontoura em gmail.com> escreveu:
>>
>>> Oi pessoal
>>>
>>> Tudo bem? Um monte de ideias bem legais!
>>>
>>> Como jornalista, acho que a aplicação da app no seu estado atual não
>>> contribuiria tanto para as redações, uma vez que o jornalista já é treinado
>>> desde cedo a escrever frases curtas na ordem direta, por exemplo.
>>>
>>> *No entanto*, uma app assim com as regras customizáveis, como foi
>>> falado, acho que seria de grande utilidade. Tomara que a investida traga
>>> mais vários frutos!
>>>
>>> Abraços,
>>>
>>> Marcelo Fontoura
>>>
>>>
>>> Em 11 de abril de 2014 18:13, Marco Túlio Pires <mtrpires em gmail.com>escreveu:
>>>
>>> boa, joão!
>>>>
>>>> Vou entrar em contato com ele!
>>>>
>>>> abração
>>>>
>>>>
>>>> 2014-04-11 18:03 GMT-03:00 João Batista Oliveira Neto <
>>>> neto.joaobatista em gmail.com>:
>>>>
>>>> Marco,
>>>>>
>>>>> Posso afirmar, com certeza absoluta, sem qualquer margem de erro, de
>>>>> que a análise sintática é 100% feita no front-end. É possível, inclusive,
>>>>> rodar a app totalmente offline.
>>>>>
>>>>> Ainda, estou com o código responsável pela análise já todo formatado.
>>>>> No código original, o dicionário está escrito utilizando notação
>>>>> hexadecimal. Já fiz a conversão de todo o dicionário para decimal e então
>>>>> para os respectivos caracteres.
>>>>>
>>>>> Se o autor nos der permissão para fazer o port para português, não
>>>>> será complicado fazê-lo.
>>>>>
>>>>> ;)
>>>>>
>>>>> --
>>>>> João Batista Neto
>>>>> Desenvolvedor engenheiro de aplicações web
>>>>>
>>>>>
>>>>> 2014-04-11 17:51 GMT-03:00 Marco Túlio Pires <mtrpires em gmail.com>:
>>>>>
>>>>> João, sensacional. Eu dei uma mexida no código e fiquei com preguiça
>>>>>> quando vi o dicionário. Mas é algo que dá pra fazer, né? Pelo que ouvi
>>>>>> dizer, mas não confirmei, o código de análise sintática não estaria no
>>>>>> front-end... Mas não é uma coisa absurda: ilumina se uma frase passar do
>>>>>> limite x de palavras, ilumina palavra se passar do limite y de caracteres,
>>>>>> aciona um dicionário de advérbios, e, pra mim a parte que deve ser a mais
>>>>>> trabalhosa... aciona a linguagem natural pra identificar voz passiva e dar
>>>>>> sugestões para substituir palavras "difíceis" — seguindo a sugestão do
>>>>>> Edgar.
>>>>>>
>>>>>> Aliás, Edgar, eu vejo esse web app como uma brincadeira... escrever
>>>>>> um texto bom é muito mais do que fazer um corte seco como esse. Mas é um
>>>>>> exercício valioso. Já melhora seu texto imensamente. Faça o teste :P — e
>>>>>> pô, como assim, Hemingway é muito bom!
>>>>>>
>>>>>> Pedro, seria uma boa, hein? Eu me inscreveria! Esse app em português
>>>>>> ajudaria jornalistas a torto e à direita. Poderia ser até um plugin de
>>>>>> wordpress, ou um código pra ser embutido nos CMSs da vida. João, a gente
>>>>>> pede autorização pros autores. Se eles não toparem (o que é provável, uma
>>>>>> vez que eles obfuscaram o código) podemos pensar em fazer o código do zero.
>>>>>>
>>>>>> abraços
>>>>>>
>>>>>>
>>>>>>
>>>>>>
>>>>>>
>>>>>>
>>>>>>
>>>>>>
>>>>>> 2014-04-11 17:40 GMT-03:00 Pedro Markun <pedro em markun.com.br>:
>>>>>>
>>>>>>> A gente esta tentando armar uma oficina de NLTK com o Fabbri por
>>>>>>> aqui.
>>>>>>>
>>>>>>> Assim que passar esse meu cronograma conturbado, engrenamos isso :)
>>>>>>>
>>>>>>> ---
>>>>>>>
>>>>>>> Em uma nota não relacionada... a gente estava pirando a uns tempos
>>>>>>> em usar TDD (test driven development) aplicado a escrita de leis. A ideia
>>>>>>> era meio essa onda... você passar um PL pelo sistema e ele apitar em
>>>>>>> questões chaves e/ou controversas.
>>>>>>>
>>>>>>>
>>>>>>> 2014-04-11 17:32 GMT-03:00 Edgar <e em vaz.io>:
>>>>>>>
>>>>>>> Existiu um discussão interessante no Hackernews sobre essa app há
>>>>>>>> algum tempo atrás:
>>>>>>>>
>>>>>>>> https://news.ycombinator.com/item?id=7223969
>>>>>>>>
>>>>>>>> Mas note que as regras para análise de texto nesse app são bem
>>>>>>>> simplórias, inclusive na discussão acima vai ver que teve um cara que
>>>>>>>> copiou e colou um texto do próprio Hemingway nesse app e obteve uma nota
>>>>>>>> baixa.
>>>>>>>>
>>>>>>>> Implementar um sistema desses com regras abertas e claras,
>>>>>>>> inclusive com possibilidade de escolher quais regras utilizar, definir
>>>>>>>> conjuntos de regras relacionadas a diferentes estilos literários, etc não
>>>>>>>> seria muito complexo enquanto as regras fossem simples e claras. Poderia
>>>>>>>> ser utilizado a fantástica biblioteca do Python NLTK
>>>>>>>> http://www.nltk.org/ para isso. Ela inclusive já possui alguns
>>>>>>>> corpus em português, dá uma olha em:
>>>>>>>>
>>>>>>>> http://www.nltk.org/howto/portuguese_en.html
>>>>>>>>
>>>>>>>> Que vai encontrar alguns exemplos de análise de concordância e
>>>>>>>> categorização léxica usando a biblioteca.
>>>>>>>> Se estiver interessado veja o livro aberto
>>>>>>>> http://www.nltk.org/book/ que é voltado para pessoas que não
>>>>>>>> necessariamente possuam experiência com programação.
>>>>>>>>
>>>>>>>> E.
>>>>>>>>
>>>>>>>> PS: Podiam ter escolhido um autor melhor para  inspirar uma app,
>>>>>>>> mas isso é só uma questão de gosto.
>>>>>>>>
>>>>>>>>
>>>>>>>>
>>>>>>>>
>>>>>>>> 2014-04-11 16:54 GMT-03:00 João Batista Oliveira Neto <
>>>>>>>> neto.joaobatista em gmail.com>:
>>>>>>>>
>>>>>>>>>  Marco,
>>>>>>>>>
>>>>>>>>> Formatei o código do algorítimo e o inspecionei superficialmente.
>>>>>>>>> Aparentemente, fazê-lo funcionar com o português não é complicado. O
>>>>>>>>> primeiro passo, obviamente, seria modificar o dicionário declarado pela
>>>>>>>>> variável _0xa19f.
>>>>>>>>>
>>>>>>>>> Vou fazer alguns experimentos aqui, mas para portá-lo para o
>>>>>>>>> português, será necessário pedir permissão para o autor.
>>>>>>>>>
>>>>>>>>> :D
>>>>>>>>>
>>>>>>>>> --
>>>>>>>>> João Batista Neto
>>>>>>>>> Desenvolvedor engenheiro de aplicações web
>>>>>>>>>
>>>>>>>>>
>>>>>>>>> 2014-04-11 16:27 GMT-03:00 Marco Túlio Pires <mtrpires em gmail.com>:
>>>>>>>>>
>>>>>>>>>>  Desculpem o cross-post, mas isso pode interessar muita gente,
>>>>>>>>>> principalmente quem trabalha com/gosta de escrever.
>>>>>>>>>>
>>>>>>>>>> Já viram o http://www.hemingwayapp.com/ ?
>>>>>>>>>>
>>>>>>>>>> O nome do app é uma alusão ao jornalista que tinha um texto
>>>>>>>>>> considerado "claro e arrojado". *Na teoria*, o app deixaria o
>>>>>>>>>> seu texto assim também.
>>>>>>>>>>
>>>>>>>>>> É uma brincadeira, mas uma brincadeira que tem fundos de verdade.
>>>>>>>>>>
>>>>>>>>>> A ideia é usar algumas das características marcantes do texto de
>>>>>>>>>> Hemingway e ver se o seu texto é assim. Frases curtas, palavras pequenas,
>>>>>>>>>> verbos fortes (em vez de advérbios), ausência da voz passiva etc.
>>>>>>>>>>
>>>>>>>>>> Nesse sentido, o app te mostra onde estão as frases grandes, os
>>>>>>>>>> advérbios, as palavras grandes e as frases que usam a voz passiva e você
>>>>>>>>>> pode tentar substituir e reescrever com o objetivo de deixar seu texto mais
>>>>>>>>>> claro.
>>>>>>>>>>
>>>>>>>>>> A cereja do bolo, ainda na linha da brincadeira, é um medidor que
>>>>>>>>>> mostra qual o grau de instrução mínimo que a pessoa deveria ter para
>>>>>>>>>> entender seu texto. A recomendação do site é que seu texto atinja um score
>>>>>>>>>> de 10 ou menos (algo como uma pessoa do primeiro ano do ensino médio
>>>>>>>>>> conseguiria ler seu texto sem problemas). O cálculo, pelo que entendi, é
>>>>>>>>>> feito a partir do número de frases, parágrafos e palavras.
>>>>>>>>>>
>>>>>>>>>> Claro que escrever um bom texto não passa apenas pelas
>>>>>>>>>> características trabalhadas no app, mas é um exercício bem legal pra tentar
>>>>>>>>>> nos disciplinar a fazer escolhas mais "claras e arrojadas".
>>>>>>>>>>
>>>>>>>>>> O único problema é que o app só funciona em inglês :(
>>>>>>>>>>
>>>>>>>>>> Abraços,
>>>>>>>>>>
>>>>>>>>>> --
>>>>>>>>>> Marco Túlio Pires :: journogeek :: @mtrpires
>>>>>>>>>>
>>>>>>>>>> _______________________________________________
>>>>>>>>>> escoladedados mailing list
>>>>>>>>>> escoladedados em lists.okfn.org
>>>>>>>>>> https://lists.okfn.org/mailman/listinfo/escoladedados
>>>>>>>>>>
>>>>>>>>>>
>>>>>>>>>
>>>>>>>>> _______________________________________________
>>>>>>>>> okfn-br mailing list
>>>>>>>>> okfn-br em lists.okfn.org
>>>>>>>>> https://lists.okfn.org/mailman/listinfo/okfn-br
>>>>>>>>> Unsubscribe: https://lists.okfn.org/mailman/options/okfn-br
>>>>>>>>>
>>>>>>>>>
>>>>>>>>  --
>>>>>>>> Você recebeu essa mensagem porque está inscrito no grupo
>>>>>>>> quot;Transparência Hacker" dos Grupos do Google.
>>>>>>>> Para cancelar inscrição nesse grupo e parar de receber e-mails
>>>>>>>> dele, envie um e-mail para thackday+unsubscribe em googlegroups.com.
>>>>>>>> Para postar nesse grupo, envie um e-mail para
>>>>>>>> thackday em googlegroups.com.
>>>>>>>> Acesse esse grupo em http://groups.google.com/group/thackday.
>>>>>>>> Para ver essa discussão na Web, acesse
>>>>>>>> https://groups.google.com/d/msgid/thackday/CAMcM9kZzHHi35FMtCHBeeq75GwfcSGuv%2B6XDUUqeA7nxKCwWsA%40mail.gmail.com<https://groups.google.com/d/msgid/thackday/CAMcM9kZzHHi35FMtCHBeeq75GwfcSGuv%2B6XDUUqeA7nxKCwWsA%40mail.gmail.com?utm_medium=email&utm_source=footer>
>>>>>>>> .
>>>>>>>> Para mais opções, acesse https://groups.google.com/d/optout.
>>>>>>>>
>>>>>>>
>>>>>>>  --
>>>>>>> Você recebeu essa mensagem porque está inscrito no grupo
>>>>>>> quot;Transparência Hacker" dos Grupos do Google.
>>>>>>> Para cancelar inscrição nesse grupo e parar de receber e-mails dele,
>>>>>>> envie um e-mail para thackday+unsubscribe em googlegroups.com.
>>>>>>> Para postar nesse grupo, envie um e-mail para
>>>>>>> thackday em googlegroups.com.
>>>>>>> Acesse esse grupo em http://groups.google.com/group/thackday.
>>>>>>> Para ver essa discussão na Web, acesse
>>>>>>> https://groups.google.com/d/msgid/thackday/CABnW7Vft94zio77bQo3irNH0Af3kfNwE7Z%2BjN4QUzRiAJDz-Pg%40mail.gmail.com<https://groups.google.com/d/msgid/thackday/CABnW7Vft94zio77bQo3irNH0Af3kfNwE7Z%2BjN4QUzRiAJDz-Pg%40mail.gmail.com?utm_medium=email&utm_source=footer>
>>>>>>> .
>>>>>>>
>>>>>>> Para mais opções, acesse https://groups.google.com/d/optout.
>>>>>>>
>>>>>>
>>>>>>
>>>>>>
>>>>>> --
>>>>>> Marco Túlio Pires :: journogeek :: @mtrpires
>>>>>>
>>>>>> _______________________________________________
>>>>>> escoladedados mailing list
>>>>>> escoladedados em lists.okfn.org
>>>>>> https://lists.okfn.org/mailman/listinfo/escoladedados
>>>>>>
>>>>>>
>>>>>
>>>>> _______________________________________________
>>>>> escoladedados mailing list
>>>>> escoladedados em lists.okfn.org
>>>>> https://lists.okfn.org/mailman/listinfo/escoladedados
>>>>>
>>>>>
>>>>
>>>>
>>>> --
>>>> Marco Túlio Pires :: journogeek :: @mtrpires
>>>>
>>>> _______________________________________________
>>>> escoladedados mailing list
>>>> escoladedados em lists.okfn.org
>>>> https://lists.okfn.org/mailman/listinfo/escoladedados
>>>>
>>>>
>>>
>>> _______________________________________________
>>> escoladedados mailing list
>>> escoladedados em lists.okfn.org
>>> https://lists.okfn.org/mailman/listinfo/escoladedados
>>>
>>>
>>  --
>> Você recebeu essa mensagem porque está inscrito no grupo
>> quot;Transparência Hacker" dos Grupos do Google.
>> Para cancelar inscrição nesse grupo e parar de receber e-mails dele,
>> envie um e-mail para thackday+unsubscribe em googlegroups.com.
>> Para postar nesse grupo, envie um e-mail para thackday em googlegroups.com.
>> Acesse esse grupo em http://groups.google.com/group/thackday.
>> Para ver essa discussão na Web, acesse
>> https://groups.google.com/d/msgid/thackday/CA%2BMF24kkzEg5xwza524CKpyVQTHYbU4wA620OKijNaPuCJGN8A%40mail.gmail.com<https://groups.google.com/d/msgid/thackday/CA%2BMF24kkzEg5xwza524CKpyVQTHYbU4wA620OKijNaPuCJGN8A%40mail.gmail.com?utm_medium=email&utm_source=footer>
>> .
>> Para mais opções, acesse https://groups.google.com/d/optout.
>>
>  --
> Você recebeu essa mensagem porque está inscrito no grupo
> quot;Transparência Hacker" dos Grupos do Google.
> Para cancelar inscrição nesse grupo e parar de receber e-mails dele, envie
> um e-mail para thackday+unsubscribe em googlegroups.com.
> Para postar nesse grupo, envie um e-mail para thackday em googlegroups.com.
> Acesse esse grupo em http://groups.google.com/group/thackday.
> Para ver essa discussão na Web, acesse
> https://groups.google.com/d/msgid/thackday/CABnW7VeyjrYNQKaaF20OJMbeYAwnNKb8vCtPN_B54eMO%2BhgdFA%40mail.gmail.com<https://groups.google.com/d/msgid/thackday/CABnW7VeyjrYNQKaaF20OJMbeYAwnNKb8vCtPN_B54eMO%2BhgdFA%40mail.gmail.com?utm_medium=email&utm_source=footer>
> .
>
> Para mais opções, acesse https://groups.google.com/d/optout.
>
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://lists.okfn.org/pipermail/escoladedados/attachments/20140420/8b9da398/attachment-0003.html>


Mais detalhes sobre a lista de discussão escoladedados