[Escola de Dados] [thackday] Re: [okfn-br] Aplicativo web para "melhorar" seu texto

Marco Túlio Pires mtrpires em gmail.com
Sexta Abril 11 20:51:42 UTC 2014


João, sensacional. Eu dei uma mexida no código e fiquei com preguiça quando
vi o dicionário. Mas é algo que dá pra fazer, né? Pelo que ouvi dizer, mas
não confirmei, o código de análise sintática não estaria no front-end...
Mas não é uma coisa absurda: ilumina se uma frase passar do limite x de
palavras, ilumina palavra se passar do limite y de caracteres, aciona um
dicionário de advérbios, e, pra mim a parte que deve ser a mais
trabalhosa... aciona a linguagem natural pra identificar voz passiva e dar
sugestões para substituir palavras "difíceis" -- seguindo a sugestão do
Edgar.

Aliás, Edgar, eu vejo esse web app como uma brincadeira... escrever um
texto bom é muito mais do que fazer um corte seco como esse. Mas é um
exercício valioso. Já melhora seu texto imensamente. Faça o teste :P -- e
pô, como assim, Hemingway é muito bom!

Pedro, seria uma boa, hein? Eu me inscreveria! Esse app em português
ajudaria jornalistas a torto e à direita. Poderia ser até um plugin de
wordpress, ou um código pra ser embutido nos CMSs da vida. João, a gente
pede autorização pros autores. Se eles não toparem (o que é provável, uma
vez que eles obfuscaram o código) podemos pensar em fazer o código do zero.

abraços








2014-04-11 17:40 GMT-03:00 Pedro Markun <pedro em markun.com.br>:

> A gente esta tentando armar uma oficina de NLTK com o Fabbri por aqui.
>
> Assim que passar esse meu cronograma conturbado, engrenamos isso :)
>
> ---
>
> Em uma nota não relacionada... a gente estava pirando a uns tempos em usar
> TDD (test driven development) aplicado a escrita de leis. A ideia era meio
> essa onda... você passar um PL pelo sistema e ele apitar em questões chaves
> e/ou controversas.
>
>
> 2014-04-11 17:32 GMT-03:00 Edgar <e em vaz.io>:
>
> Existiu um discussão interessante no Hackernews sobre essa app há algum
>> tempo atrás:
>>
>> https://news.ycombinator.com/item?id=7223969
>>
>> Mas note que as regras para análise de texto nesse app são bem
>> simplórias, inclusive na discussão acima vai ver que teve um cara que
>> copiou e colou um texto do próprio Hemingway nesse app e obteve uma nota
>> baixa.
>>
>> Implementar um sistema desses com regras abertas e claras, inclusive com
>> possibilidade de escolher quais regras utilizar, definir conjuntos de
>> regras relacionadas a diferentes estilos literários, etc não seria muito
>> complexo enquanto as regras fossem simples e claras. Poderia ser utilizado
>> a fantástica biblioteca do Python NLTK http://www.nltk.org/ para isso.
>> Ela inclusive já possui alguns corpus em português, dá uma olha em:
>>
>> http://www.nltk.org/howto/portuguese_en.html
>>
>> Que vai encontrar alguns exemplos de análise de concordância e
>> categorização léxica usando a biblioteca.
>> Se estiver interessado veja o livro aberto http://www.nltk.org/book/ que
>> é voltado para pessoas que não necessariamente possuam experiência com
>> programação.
>>
>> E.
>>
>> PS: Podiam ter escolhido um autor melhor para  inspirar uma app, mas isso
>> é só uma questão de gosto.
>>
>>
>>
>>
>> 2014-04-11 16:54 GMT-03:00 João Batista Oliveira Neto <
>> neto.joaobatista em gmail.com>:
>>
>>>  Marco,
>>>
>>> Formatei o código do algorítimo e o inspecionei superficialmente.
>>> Aparentemente, fazê-lo funcionar com o português não é complicado. O
>>> primeiro passo, obviamente, seria modificar o dicionário declarado pela
>>> variável _0xa19f.
>>>
>>> Vou fazer alguns experimentos aqui, mas para portá-lo para o português,
>>> será necessário pedir permissão para o autor.
>>>
>>> :D
>>>
>>> --
>>> João Batista Neto
>>> Desenvolvedor engenheiro de aplicações web
>>>
>>>
>>> 2014-04-11 16:27 GMT-03:00 Marco Túlio Pires <mtrpires em gmail.com>:
>>>
>>>>  Desculpem o cross-post, mas isso pode interessar muita gente,
>>>> principalmente quem trabalha com/gosta de escrever.
>>>>
>>>> Já viram o http://www.hemingwayapp.com/ ?
>>>>
>>>> O nome do app é uma alusão ao jornalista que tinha um texto considerado
>>>> "claro e arrojado". *Na teoria*, o app deixaria o seu texto assim
>>>> também.
>>>>
>>>> É uma brincadeira, mas uma brincadeira que tem fundos de verdade.
>>>>
>>>> A ideia é usar algumas das características marcantes do texto de
>>>> Hemingway e ver se o seu texto é assim. Frases curtas, palavras pequenas,
>>>> verbos fortes (em vez de advérbios), ausência da voz passiva etc.
>>>>
>>>> Nesse sentido, o app te mostra onde estão as frases grandes, os
>>>> advérbios, as palavras grandes e as frases que usam a voz passiva e você
>>>> pode tentar substituir e reescrever com o objetivo de deixar seu texto mais
>>>> claro.
>>>>
>>>> A cereja do bolo, ainda na linha da brincadeira, é um medidor que
>>>> mostra qual o grau de instrução mínimo que a pessoa deveria ter para
>>>> entender seu texto. A recomendação do site é que seu texto atinja um score
>>>> de 10 ou menos (algo como uma pessoa do primeiro ano do ensino médio
>>>> conseguiria ler seu texto sem problemas). O cálculo, pelo que entendi, é
>>>> feito a partir do número de frases, parágrafos e palavras.
>>>>
>>>> Claro que escrever um bom texto não passa apenas pelas características
>>>> trabalhadas no app, mas é um exercício bem legal pra tentar nos disciplinar
>>>> a fazer escolhas mais "claras e arrojadas".
>>>>
>>>> O único problema é que o app só funciona em inglês :(
>>>>
>>>> Abraços,
>>>>
>>>> --
>>>> Marco Túlio Pires :: journogeek :: @mtrpires
>>>>
>>>> _______________________________________________
>>>> escoladedados mailing list
>>>> escoladedados em lists.okfn.org
>>>> https://lists.okfn.org/mailman/listinfo/escoladedados
>>>>
>>>>
>>>
>>> _______________________________________________
>>> okfn-br mailing list
>>> okfn-br em lists.okfn.org
>>> https://lists.okfn.org/mailman/listinfo/okfn-br
>>> Unsubscribe: https://lists.okfn.org/mailman/options/okfn-br
>>>
>>>
>>  --
>> Você recebeu essa mensagem porque está inscrito no grupo
>> quot;Transparência Hacker" dos Grupos do Google.
>> Para cancelar inscrição nesse grupo e parar de receber e-mails dele,
>> envie um e-mail para thackday+unsubscribe em googlegroups.com.
>> Para postar nesse grupo, envie um e-mail para thackday em googlegroups.com.
>> Acesse esse grupo em http://groups.google.com/group/thackday.
>> Para ver essa discussão na Web, acesse
>> https://groups.google.com/d/msgid/thackday/CAMcM9kZzHHi35FMtCHBeeq75GwfcSGuv%2B6XDUUqeA7nxKCwWsA%40mail.gmail.com<https://groups.google.com/d/msgid/thackday/CAMcM9kZzHHi35FMtCHBeeq75GwfcSGuv%2B6XDUUqeA7nxKCwWsA%40mail.gmail.com?utm_medium=email&utm_source=footer>
>> .
>> Para mais opções, acesse https://groups.google.com/d/optout.
>>
>
>  --
> Você recebeu essa mensagem porque está inscrito no grupo
> quot;Transparência Hacker" dos Grupos do Google.
> Para cancelar inscrição nesse grupo e parar de receber e-mails dele, envie
> um e-mail para thackday+unsubscribe em googlegroups.com.
> Para postar nesse grupo, envie um e-mail para thackday em googlegroups.com.
> Acesse esse grupo em http://groups.google.com/group/thackday.
> Para ver essa discussão na Web, acesse
> https://groups.google.com/d/msgid/thackday/CABnW7Vft94zio77bQo3irNH0Af3kfNwE7Z%2BjN4QUzRiAJDz-Pg%40mail.gmail.com<https://groups.google.com/d/msgid/thackday/CABnW7Vft94zio77bQo3irNH0Af3kfNwE7Z%2BjN4QUzRiAJDz-Pg%40mail.gmail.com?utm_medium=email&utm_source=footer>
> .
>
> Para mais opções, acesse https://groups.google.com/d/optout.
>



-- 
Marco Túlio Pires :: journogeek :: @mtrpires
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://lists.okfn.org/pipermail/escoladedados/attachments/20140411/d1c771ce/attachment-0003.html>


Mais detalhes sobre a lista de discussão escoladedados