[Escola de Dados] [thackday] Re: [okfn-br] Aplicativo web para "melhorar" seu texto

Marcelo Fontoura marcelocfontoura em gmail.com
Sexta Abril 11 21:23:59 UTC 2014


Oi pessoal

Tudo bem? Um monte de ideias bem legais!

Como jornalista, acho que a aplicação da app no seu estado atual não
contribuiria tanto para as redações, uma vez que o jornalista já é treinado
desde cedo a escrever frases curtas na ordem direta, por exemplo.

*No entanto*, uma app assim com as regras customizáveis, como foi falado,
acho que seria de grande utilidade. Tomara que a investida traga mais
vários frutos!

Abraços,

Marcelo Fontoura


Em 11 de abril de 2014 18:13, Marco Túlio Pires <mtrpires em gmail.com>escreveu:

> boa, joão!
>
> Vou entrar em contato com ele!
>
> abração
>
>
> 2014-04-11 18:03 GMT-03:00 João Batista Oliveira Neto <
> neto.joaobatista em gmail.com>:
>
> Marco,
>>
>> Posso afirmar, com certeza absoluta, sem qualquer margem de erro, de que
>> a análise sintática é 100% feita no front-end. É possível, inclusive, rodar
>> a app totalmente offline.
>>
>> Ainda, estou com o código responsável pela análise já todo formatado. No
>> código original, o dicionário está escrito utilizando notação hexadecimal.
>> Já fiz a conversão de todo o dicionário para decimal e então para os
>> respectivos caracteres.
>>
>> Se o autor nos der permissão para fazer o port para português, não será
>> complicado fazê-lo.
>>
>> ;)
>>
>> --
>> João Batista Neto
>> Desenvolvedor engenheiro de aplicações web
>>
>>
>> 2014-04-11 17:51 GMT-03:00 Marco Túlio Pires <mtrpires em gmail.com>:
>>
>> João, sensacional. Eu dei uma mexida no código e fiquei com preguiça
>>> quando vi o dicionário. Mas é algo que dá pra fazer, né? Pelo que ouvi
>>> dizer, mas não confirmei, o código de análise sintática não estaria no
>>> front-end... Mas não é uma coisa absurda: ilumina se uma frase passar do
>>> limite x de palavras, ilumina palavra se passar do limite y de caracteres,
>>> aciona um dicionário de advérbios, e, pra mim a parte que deve ser a mais
>>> trabalhosa... aciona a linguagem natural pra identificar voz passiva e dar
>>> sugestões para substituir palavras "difíceis" -- seguindo a sugestão do
>>> Edgar.
>>>
>>> Aliás, Edgar, eu vejo esse web app como uma brincadeira... escrever um
>>> texto bom é muito mais do que fazer um corte seco como esse. Mas é um
>>> exercício valioso. Já melhora seu texto imensamente. Faça o teste :P -- e
>>> pô, como assim, Hemingway é muito bom!
>>>
>>> Pedro, seria uma boa, hein? Eu me inscreveria! Esse app em português
>>> ajudaria jornalistas a torto e à direita. Poderia ser até um plugin de
>>> wordpress, ou um código pra ser embutido nos CMSs da vida. João, a gente
>>> pede autorização pros autores. Se eles não toparem (o que é provável, uma
>>> vez que eles obfuscaram o código) podemos pensar em fazer o código do zero.
>>>
>>> abraços
>>>
>>>
>>>
>>>
>>>
>>>
>>>
>>>
>>> 2014-04-11 17:40 GMT-03:00 Pedro Markun <pedro em markun.com.br>:
>>>
>>>> A gente esta tentando armar uma oficina de NLTK com o Fabbri por aqui.
>>>>
>>>> Assim que passar esse meu cronograma conturbado, engrenamos isso :)
>>>>
>>>> ---
>>>>
>>>> Em uma nota não relacionada... a gente estava pirando a uns tempos em
>>>> usar TDD (test driven development) aplicado a escrita de leis. A ideia era
>>>> meio essa onda... você passar um PL pelo sistema e ele apitar em questões
>>>> chaves e/ou controversas.
>>>>
>>>>
>>>> 2014-04-11 17:32 GMT-03:00 Edgar <e em vaz.io>:
>>>>
>>>> Existiu um discussão interessante no Hackernews sobre essa app há algum
>>>>> tempo atrás:
>>>>>
>>>>> https://news.ycombinator.com/item?id=7223969
>>>>>
>>>>> Mas note que as regras para análise de texto nesse app são bem
>>>>> simplórias, inclusive na discussão acima vai ver que teve um cara que
>>>>> copiou e colou um texto do próprio Hemingway nesse app e obteve uma nota
>>>>> baixa.
>>>>>
>>>>> Implementar um sistema desses com regras abertas e claras, inclusive
>>>>> com possibilidade de escolher quais regras utilizar, definir conjuntos de
>>>>> regras relacionadas a diferentes estilos literários, etc não seria muito
>>>>> complexo enquanto as regras fossem simples e claras. Poderia ser utilizado
>>>>> a fantástica biblioteca do Python NLTK http://www.nltk.org/ para
>>>>> isso. Ela inclusive já possui alguns corpus em português, dá uma olha em:
>>>>>
>>>>> http://www.nltk.org/howto/portuguese_en.html
>>>>>
>>>>> Que vai encontrar alguns exemplos de análise de concordância e
>>>>> categorização léxica usando a biblioteca.
>>>>> Se estiver interessado veja o livro aberto http://www.nltk.org/book/que é voltado para pessoas que não necessariamente possuam experiência com
>>>>> programação.
>>>>>
>>>>> E.
>>>>>
>>>>> PS: Podiam ter escolhido um autor melhor para  inspirar uma app, mas
>>>>> isso é só uma questão de gosto.
>>>>>
>>>>>
>>>>>
>>>>>
>>>>> 2014-04-11 16:54 GMT-03:00 João Batista Oliveira Neto <
>>>>> neto.joaobatista em gmail.com>:
>>>>>
>>>>>>  Marco,
>>>>>>
>>>>>> Formatei o código do algorítimo e o inspecionei superficialmente.
>>>>>> Aparentemente, fazê-lo funcionar com o português não é complicado. O
>>>>>> primeiro passo, obviamente, seria modificar o dicionário declarado pela
>>>>>> variável _0xa19f.
>>>>>>
>>>>>> Vou fazer alguns experimentos aqui, mas para portá-lo para o
>>>>>> português, será necessário pedir permissão para o autor.
>>>>>>
>>>>>> :D
>>>>>>
>>>>>> --
>>>>>> João Batista Neto
>>>>>> Desenvolvedor engenheiro de aplicações web
>>>>>>
>>>>>>
>>>>>> 2014-04-11 16:27 GMT-03:00 Marco Túlio Pires <mtrpires em gmail.com>:
>>>>>>
>>>>>>>  Desculpem o cross-post, mas isso pode interessar muita gente,
>>>>>>> principalmente quem trabalha com/gosta de escrever.
>>>>>>>
>>>>>>> Já viram o http://www.hemingwayapp.com/ ?
>>>>>>>
>>>>>>> O nome do app é uma alusão ao jornalista que tinha um texto
>>>>>>> considerado "claro e arrojado". *Na teoria*, o app deixaria o seu
>>>>>>> texto assim também.
>>>>>>>
>>>>>>> É uma brincadeira, mas uma brincadeira que tem fundos de verdade.
>>>>>>>
>>>>>>> A ideia é usar algumas das características marcantes do texto de
>>>>>>> Hemingway e ver se o seu texto é assim. Frases curtas, palavras pequenas,
>>>>>>> verbos fortes (em vez de advérbios), ausência da voz passiva etc.
>>>>>>>
>>>>>>> Nesse sentido, o app te mostra onde estão as frases grandes, os
>>>>>>> advérbios, as palavras grandes e as frases que usam a voz passiva e você
>>>>>>> pode tentar substituir e reescrever com o objetivo de deixar seu texto mais
>>>>>>> claro.
>>>>>>>
>>>>>>> A cereja do bolo, ainda na linha da brincadeira, é um medidor que
>>>>>>> mostra qual o grau de instrução mínimo que a pessoa deveria ter para
>>>>>>> entender seu texto. A recomendação do site é que seu texto atinja um score
>>>>>>> de 10 ou menos (algo como uma pessoa do primeiro ano do ensino médio
>>>>>>> conseguiria ler seu texto sem problemas). O cálculo, pelo que entendi, é
>>>>>>> feito a partir do número de frases, parágrafos e palavras.
>>>>>>>
>>>>>>> Claro que escrever um bom texto não passa apenas pelas
>>>>>>> características trabalhadas no app, mas é um exercício bem legal pra tentar
>>>>>>> nos disciplinar a fazer escolhas mais "claras e arrojadas".
>>>>>>>
>>>>>>> O único problema é que o app só funciona em inglês :(
>>>>>>>
>>>>>>> Abraços,
>>>>>>>
>>>>>>> --
>>>>>>> Marco Túlio Pires :: journogeek :: @mtrpires
>>>>>>>
>>>>>>> _______________________________________________
>>>>>>> escoladedados mailing list
>>>>>>> escoladedados em lists.okfn.org
>>>>>>> https://lists.okfn.org/mailman/listinfo/escoladedados
>>>>>>>
>>>>>>>
>>>>>>
>>>>>> _______________________________________________
>>>>>> okfn-br mailing list
>>>>>> okfn-br em lists.okfn.org
>>>>>> https://lists.okfn.org/mailman/listinfo/okfn-br
>>>>>> Unsubscribe: https://lists.okfn.org/mailman/options/okfn-br
>>>>>>
>>>>>>
>>>>>  --
>>>>> Você recebeu essa mensagem porque está inscrito no grupo
>>>>> quot;Transparência Hacker" dos Grupos do Google.
>>>>> Para cancelar inscrição nesse grupo e parar de receber e-mails dele,
>>>>> envie um e-mail para thackday+unsubscribe em googlegroups.com.
>>>>> Para postar nesse grupo, envie um e-mail para
>>>>> thackday em googlegroups.com.
>>>>> Acesse esse grupo em http://groups.google.com/group/thackday.
>>>>> Para ver essa discussão na Web, acesse
>>>>> https://groups.google.com/d/msgid/thackday/CAMcM9kZzHHi35FMtCHBeeq75GwfcSGuv%2B6XDUUqeA7nxKCwWsA%40mail.gmail.com<https://groups.google.com/d/msgid/thackday/CAMcM9kZzHHi35FMtCHBeeq75GwfcSGuv%2B6XDUUqeA7nxKCwWsA%40mail.gmail.com?utm_medium=email&utm_source=footer>
>>>>> .
>>>>> Para mais opções, acesse https://groups.google.com/d/optout.
>>>>>
>>>>
>>>>  --
>>>> Você recebeu essa mensagem porque está inscrito no grupo
>>>> quot;Transparência Hacker" dos Grupos do Google.
>>>> Para cancelar inscrição nesse grupo e parar de receber e-mails dele,
>>>> envie um e-mail para thackday+unsubscribe em googlegroups.com.
>>>> Para postar nesse grupo, envie um e-mail para thackday em googlegroups.com
>>>> .
>>>> Acesse esse grupo em http://groups.google.com/group/thackday.
>>>> Para ver essa discussão na Web, acesse
>>>> https://groups.google.com/d/msgid/thackday/CABnW7Vft94zio77bQo3irNH0Af3kfNwE7Z%2BjN4QUzRiAJDz-Pg%40mail.gmail.com<https://groups.google.com/d/msgid/thackday/CABnW7Vft94zio77bQo3irNH0Af3kfNwE7Z%2BjN4QUzRiAJDz-Pg%40mail.gmail.com?utm_medium=email&utm_source=footer>
>>>> .
>>>>
>>>> Para mais opções, acesse https://groups.google.com/d/optout.
>>>>
>>>
>>>
>>>
>>> --
>>> Marco Túlio Pires :: journogeek :: @mtrpires
>>>
>>> _______________________________________________
>>> escoladedados mailing list
>>> escoladedados em lists.okfn.org
>>> https://lists.okfn.org/mailman/listinfo/escoladedados
>>>
>>>
>>
>> _______________________________________________
>> escoladedados mailing list
>> escoladedados em lists.okfn.org
>> https://lists.okfn.org/mailman/listinfo/escoladedados
>>
>>
>
>
> --
> Marco Túlio Pires :: journogeek :: @mtrpires
>
> _______________________________________________
> escoladedados mailing list
> escoladedados em lists.okfn.org
> https://lists.okfn.org/mailman/listinfo/escoladedados
>
>
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://lists.okfn.org/pipermail/escoladedados/attachments/20140411/29f60d2a/attachment-0003.html>


Mais detalhes sobre a lista de discussão escoladedados