[okfn-br] [Escola de Dados] [thackday] Re: Aplicativo web para "melhorar" seu texto

Pedro Markun pedro em markun.com.br
Sábado Abril 12 20:43:17 UTC 2014


Isso é um bom plugin pra texto legislativo.

—— escrito no celular
On Apr 12, 2014 5:34 PM, "Marcelo Träsel" <marcelo.trasel em gmail.com> wrote:

> Esse app me lembra um plugin de WordPress que comparava os posts com um
> dicionário das dez mil palavras mais usadas no inglês e sugeria retirar as
> que não estivessem no banco de dados, para melhorar a compreensibilidade do
> texto pelo afegão médio.
>
> Acho que seria útil algo assim nas redações, onde se procura ser o mais
> compreensível possível. Por outro lado, prefiro a abordagem de tentar
> educar o leitor. Achei legal o design do De Correspondent, que coloca
> setinhas nas siglas e palavras complicadas. Clicando-se nelas, aparece um
> parágrafo de definição que é fácil de colapsar depois:
>
>
> https://decorrespondent.nl/393/deel-je-kliekjes-kweek-je-vlees-manipuleer-je-broccoli/35254065-518d5989
>
> ______________
> marcelo träsel
> http://www.trasel.com.br
>
> O que é difícil? Conhecer a si mesmo.
> O que é fácil? Aconselhar os outros.
>
>                                     -- Tales de Mileto
>
>
> Em 11 de abril de 2014 18:23, Marcelo Fontoura <marcelocfontoura em gmail.com
> > escreveu:
>
>> Oi pessoal
>>
>> Tudo bem? Um monte de ideias bem legais!
>>
>> Como jornalista, acho que a aplicação da app no seu estado atual não
>> contribuiria tanto para as redações, uma vez que o jornalista já é treinado
>> desde cedo a escrever frases curtas na ordem direta, por exemplo.
>>
>> *No entanto*, uma app assim com as regras customizáveis, como foi
>> falado, acho que seria de grande utilidade. Tomara que a investida traga
>> mais vários frutos!
>>
>> Abraços,
>>
>> Marcelo Fontoura
>>
>>
>> Em 11 de abril de 2014 18:13, Marco Túlio Pires <mtrpires em gmail.com>escreveu:
>>
>> boa, joão!
>>>
>>> Vou entrar em contato com ele!
>>>
>>> abração
>>>
>>>
>>> 2014-04-11 18:03 GMT-03:00 João Batista Oliveira Neto <
>>> neto.joaobatista em gmail.com>:
>>>
>>> Marco,
>>>>
>>>> Posso afirmar, com certeza absoluta, sem qualquer margem de erro, de
>>>> que a análise sintática é 100% feita no front-end. É possível, inclusive,
>>>> rodar a app totalmente offline.
>>>>
>>>> Ainda, estou com o código responsável pela análise já todo formatado.
>>>> No código original, o dicionário está escrito utilizando notação
>>>> hexadecimal. Já fiz a conversão de todo o dicionário para decimal e então
>>>> para os respectivos caracteres.
>>>>
>>>> Se o autor nos der permissão para fazer o port para português, não será
>>>> complicado fazê-lo.
>>>>
>>>> ;)
>>>>
>>>> --
>>>> João Batista Neto
>>>> Desenvolvedor engenheiro de aplicações web
>>>>
>>>>
>>>> 2014-04-11 17:51 GMT-03:00 Marco Túlio Pires <mtrpires em gmail.com>:
>>>>
>>>> João, sensacional. Eu dei uma mexida no código e fiquei com preguiça
>>>>> quando vi o dicionário. Mas é algo que dá pra fazer, né? Pelo que ouvi
>>>>> dizer, mas não confirmei, o código de análise sintática não estaria no
>>>>> front-end... Mas não é uma coisa absurda: ilumina se uma frase passar do
>>>>> limite x de palavras, ilumina palavra se passar do limite y de caracteres,
>>>>> aciona um dicionário de advérbios, e, pra mim a parte que deve ser a mais
>>>>> trabalhosa... aciona a linguagem natural pra identificar voz passiva e dar
>>>>> sugestões para substituir palavras "difíceis" — seguindo a sugestão do
>>>>> Edgar.
>>>>>
>>>>> Aliás, Edgar, eu vejo esse web app como uma brincadeira... escrever um
>>>>> texto bom é muito mais do que fazer um corte seco como esse. Mas é um
>>>>> exercício valioso. Já melhora seu texto imensamente. Faça o teste :P — e
>>>>> pô, como assim, Hemingway é muito bom!
>>>>>
>>>>> Pedro, seria uma boa, hein? Eu me inscreveria! Esse app em português
>>>>> ajudaria jornalistas a torto e à direita. Poderia ser até um plugin de
>>>>> wordpress, ou um código pra ser embutido nos CMSs da vida. João, a gente
>>>>> pede autorização pros autores. Se eles não toparem (o que é provável, uma
>>>>> vez que eles obfuscaram o código) podemos pensar em fazer o código do zero.
>>>>>
>>>>> abraços
>>>>>
>>>>>
>>>>>
>>>>>
>>>>>
>>>>>
>>>>>
>>>>>
>>>>> 2014-04-11 17:40 GMT-03:00 Pedro Markun <pedro em markun.com.br>:
>>>>>
>>>>>> A gente esta tentando armar uma oficina de NLTK com o Fabbri por aqui.
>>>>>>
>>>>>> Assim que passar esse meu cronograma conturbado, engrenamos isso :)
>>>>>>
>>>>>> ---
>>>>>>
>>>>>> Em uma nota não relacionada... a gente estava pirando a uns tempos em
>>>>>> usar TDD (test driven development) aplicado a escrita de leis. A ideia era
>>>>>> meio essa onda... você passar um PL pelo sistema e ele apitar em questões
>>>>>> chaves e/ou controversas.
>>>>>>
>>>>>>
>>>>>> 2014-04-11 17:32 GMT-03:00 Edgar <e em vaz.io>:
>>>>>>
>>>>>> Existiu um discussão interessante no Hackernews sobre essa app há
>>>>>>> algum tempo atrás:
>>>>>>>
>>>>>>> https://news.ycombinator.com/item?id=7223969
>>>>>>>
>>>>>>> Mas note que as regras para análise de texto nesse app são bem
>>>>>>> simplórias, inclusive na discussão acima vai ver que teve um cara que
>>>>>>> copiou e colou um texto do próprio Hemingway nesse app e obteve uma nota
>>>>>>> baixa.
>>>>>>>
>>>>>>> Implementar um sistema desses com regras abertas e claras, inclusive
>>>>>>> com possibilidade de escolher quais regras utilizar, definir conjuntos de
>>>>>>> regras relacionadas a diferentes estilos literários, etc não seria muito
>>>>>>> complexo enquanto as regras fossem simples e claras. Poderia ser utilizado
>>>>>>> a fantástica biblioteca do Python NLTK http://www.nltk.org/ para
>>>>>>> isso. Ela inclusive já possui alguns corpus em português, dá uma olha em:
>>>>>>>
>>>>>>> http://www.nltk.org/howto/portuguese_en.html
>>>>>>>
>>>>>>> Que vai encontrar alguns exemplos de análise de concordância e
>>>>>>> categorização léxica usando a biblioteca.
>>>>>>> Se estiver interessado veja o livro aberto http://www.nltk.org/book/que é voltado para pessoas que não necessariamente possuam experiência com
>>>>>>> programação.
>>>>>>>
>>>>>>> E.
>>>>>>>
>>>>>>> PS: Podiam ter escolhido um autor melhor para  inspirar uma app, mas
>>>>>>> isso é só uma questão de gosto.
>>>>>>>
>>>>>>>
>>>>>>>
>>>>>>>
>>>>>>> 2014-04-11 16:54 GMT-03:00 João Batista Oliveira Neto <
>>>>>>> neto.joaobatista em gmail.com>:
>>>>>>>
>>>>>>>>  Marco,
>>>>>>>>
>>>>>>>> Formatei o código do algorítimo e o inspecionei superficialmente.
>>>>>>>> Aparentemente, fazê-lo funcionar com o português não é complicado. O
>>>>>>>> primeiro passo, obviamente, seria modificar o dicionário declarado pela
>>>>>>>> variável _0xa19f.
>>>>>>>>
>>>>>>>> Vou fazer alguns experimentos aqui, mas para portá-lo para o
>>>>>>>> português, será necessário pedir permissão para o autor.
>>>>>>>>
>>>>>>>> :D
>>>>>>>>
>>>>>>>> --
>>>>>>>> João Batista Neto
>>>>>>>> Desenvolvedor engenheiro de aplicações web
>>>>>>>>
>>>>>>>>
>>>>>>>> 2014-04-11 16:27 GMT-03:00 Marco Túlio Pires <mtrpires em gmail.com>:
>>>>>>>>
>>>>>>>>>  Desculpem o cross-post, mas isso pode interessar muita gente,
>>>>>>>>> principalmente quem trabalha com/gosta de escrever.
>>>>>>>>>
>>>>>>>>> Já viram o http://www.hemingwayapp.com/ ?
>>>>>>>>>
>>>>>>>>> O nome do app é uma alusão ao jornalista que tinha um texto
>>>>>>>>> considerado "claro e arrojado". *Na teoria*, o app deixaria o seu
>>>>>>>>> texto assim também.
>>>>>>>>>
>>>>>>>>> É uma brincadeira, mas uma brincadeira que tem fundos de verdade.
>>>>>>>>>
>>>>>>>>> A ideia é usar algumas das características marcantes do texto de
>>>>>>>>> Hemingway e ver se o seu texto é assim. Frases curtas, palavras pequenas,
>>>>>>>>> verbos fortes (em vez de advérbios), ausência da voz passiva etc.
>>>>>>>>>
>>>>>>>>> Nesse sentido, o app te mostra onde estão as frases grandes, os
>>>>>>>>> advérbios, as palavras grandes e as frases que usam a voz passiva e você
>>>>>>>>> pode tentar substituir e reescrever com o objetivo de deixar seu texto mais
>>>>>>>>> claro.
>>>>>>>>>
>>>>>>>>> A cereja do bolo, ainda na linha da brincadeira, é um medidor que
>>>>>>>>> mostra qual o grau de instrução mínimo que a pessoa deveria ter para
>>>>>>>>> entender seu texto. A recomendação do site é que seu texto atinja um score
>>>>>>>>> de 10 ou menos (algo como uma pessoa do primeiro ano do ensino médio
>>>>>>>>> conseguiria ler seu texto sem problemas). O cálculo, pelo que entendi, é
>>>>>>>>> feito a partir do número de frases, parágrafos e palavras.
>>>>>>>>>
>>>>>>>>> Claro que escrever um bom texto não passa apenas pelas
>>>>>>>>> características trabalhadas no app, mas é um exercício bem legal pra tentar
>>>>>>>>> nos disciplinar a fazer escolhas mais "claras e arrojadas".
>>>>>>>>>
>>>>>>>>> O único problema é que o app só funciona em inglês :(
>>>>>>>>>
>>>>>>>>> Abraços,
>>>>>>>>>
>>>>>>>>> --
>>>>>>>>> Marco Túlio Pires :: journogeek :: @mtrpires
>>>>>>>>>
>>>>>>>>> _______________________________________________
>>>>>>>>> escoladedados mailing list
>>>>>>>>> escoladedados em lists.okfn.org
>>>>>>>>> https://lists.okfn.org/mailman/listinfo/escoladedados
>>>>>>>>>
>>>>>>>>>
>>>>>>>>
>>>>>>>> _______________________________________________
>>>>>>>> okfn-br mailing list
>>>>>>>> okfn-br em lists.okfn.org
>>>>>>>> https://lists.okfn.org/mailman/listinfo/okfn-br
>>>>>>>> Unsubscribe: https://lists.okfn.org/mailman/options/okfn-br
>>>>>>>>
>>>>>>>>
>>>>>>>  --
>>>>>>> Você recebeu essa mensagem porque está inscrito no grupo
>>>>>>> quot;Transparência Hacker" dos Grupos do Google.
>>>>>>> Para cancelar inscrição nesse grupo e parar de receber e-mails dele,
>>>>>>> envie um e-mail para thackday+unsubscribe em googlegroups.com.
>>>>>>> Para postar nesse grupo, envie um e-mail para
>>>>>>> thackday em googlegroups.com.
>>>>>>> Acesse esse grupo em http://groups.google.com/group/thackday.
>>>>>>> Para ver essa discussão na Web, acesse
>>>>>>> https://groups.google.com/d/msgid/thackday/CAMcM9kZzHHi35FMtCHBeeq75GwfcSGuv%2B6XDUUqeA7nxKCwWsA%40mail.gmail.com<https://groups.google.com/d/msgid/thackday/CAMcM9kZzHHi35FMtCHBeeq75GwfcSGuv%2B6XDUUqeA7nxKCwWsA%40mail.gmail.com?utm_medium=email&utm_source=footer>
>>>>>>> .
>>>>>>> Para mais opções, acesse https://groups.google.com/d/optout.
>>>>>>>
>>>>>>
>>>>>>  --
>>>>>> Você recebeu essa mensagem porque está inscrito no grupo
>>>>>> quot;Transparência Hacker" dos Grupos do Google.
>>>>>> Para cancelar inscrição nesse grupo e parar de receber e-mails dele,
>>>>>> envie um e-mail para thackday+unsubscribe em googlegroups.com.
>>>>>> Para postar nesse grupo, envie um e-mail para
>>>>>> thackday em googlegroups.com.
>>>>>> Acesse esse grupo em http://groups.google.com/group/thackday.
>>>>>> Para ver essa discussão na Web, acesse
>>>>>> https://groups.google.com/d/msgid/thackday/CABnW7Vft94zio77bQo3irNH0Af3kfNwE7Z%2BjN4QUzRiAJDz-Pg%40mail.gmail.com<https://groups.google.com/d/msgid/thackday/CABnW7Vft94zio77bQo3irNH0Af3kfNwE7Z%2BjN4QUzRiAJDz-Pg%40mail.gmail.com?utm_medium=email&utm_source=footer>
>>>>>> .
>>>>>>
>>>>>> Para mais opções, acesse https://groups.google.com/d/optout.
>>>>>>
>>>>>
>>>>>
>>>>>
>>>>> --
>>>>> Marco Túlio Pires :: journogeek :: @mtrpires
>>>>>
>>>>> _______________________________________________
>>>>> escoladedados mailing list
>>>>> escoladedados em lists.okfn.org
>>>>> https://lists.okfn.org/mailman/listinfo/escoladedados
>>>>>
>>>>>
>>>>
>>>> _______________________________________________
>>>> escoladedados mailing list
>>>> escoladedados em lists.okfn.org
>>>> https://lists.okfn.org/mailman/listinfo/escoladedados
>>>>
>>>>
>>>
>>>
>>> --
>>> Marco Túlio Pires :: journogeek :: @mtrpires
>>>
>>> _______________________________________________
>>> escoladedados mailing list
>>> escoladedados em lists.okfn.org
>>> https://lists.okfn.org/mailman/listinfo/escoladedados
>>>
>>>
>>
>> _______________________________________________
>> escoladedados mailing list
>> escoladedados em lists.okfn.org
>> https://lists.okfn.org/mailman/listinfo/escoladedados
>>
>>
>  --
> Você recebeu essa mensagem porque está inscrito no grupo
> quot;Transparência Hacker" dos Grupos do Google.
> Para cancelar inscrição nesse grupo e parar de receber e-mails dele, envie
> um e-mail para thackday+unsubscribe em googlegroups.com.
> Para postar nesse grupo, envie um e-mail para thackday em googlegroups.com.
> Acesse esse grupo em http://groups.google.com/group/thackday.
> Para ver essa discussão na Web, acesse
> https://groups.google.com/d/msgid/thackday/CA%2BMF24kkzEg5xwza524CKpyVQTHYbU4wA620OKijNaPuCJGN8A%40mail.gmail.com<https://groups.google.com/d/msgid/thackday/CA%2BMF24kkzEg5xwza524CKpyVQTHYbU4wA620OKijNaPuCJGN8A%40mail.gmail.com?utm_medium=email&utm_source=footer>
> .
> Para mais opções, acesse https://groups.google.com/d/optout.
>
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://lists.okfn.org/pipermail/okfn-br/attachments/20140412/1f045a08/attachment-0005.html>


Mais detalhes sobre a lista de discussão okfn-br