[okfn-br] [Escola de Dados] Aplicativo web para "melhorar" seu texto

Edgar e em vaz.io
Sexta Abril 11 20:32:31 UTC 2014


Existiu um discussão interessante no Hackernews sobre essa app há algum
tempo atrás:

https://news.ycombinator.com/item?id=7223969

Mas note que as regras para análise de texto nesse app são bem simplórias,
inclusive na discussão acima vai ver que teve um cara que copiou e colou um
texto do próprio Hemingway nesse app e obteve uma nota baixa.

Implementar um sistema desses com regras abertas e claras, inclusive com
possibilidade de escolher quais regras utilizar, definir conjuntos de
regras relacionadas a diferentes estilos literários, etc não seria muito
complexo enquanto as regras fossem simples e claras. Poderia ser utilizado
a fantástica biblioteca do Python NLTK http://www.nltk.org/ para isso. Ela
inclusive já possui alguns corpus em português, dá uma olha em:

http://www.nltk.org/howto/portuguese_en.html

Que vai encontrar alguns exemplos de análise de concordância e
categorização léxica usando a biblioteca.
Se estiver interessado veja o livro aberto http://www.nltk.org/book/ que é
voltado para pessoas que não necessariamente possuam experiência com
programação.

E.

PS: Podiam ter escolhido um autor melhor para  inspirar uma app, mas isso é
só uma questão de gosto.




2014-04-11 16:54 GMT-03:00 João Batista Oliveira Neto <
neto.joaobatista em gmail.com>:

> Marco,
>
> Formatei o código do algorítimo e o inspecionei superficialmente.
> Aparentemente, fazê-lo funcionar com o português não é complicado. O
> primeiro passo, obviamente, seria modificar o dicionário declarado pela
> variável _0xa19f.
>
> Vou fazer alguns experimentos aqui, mas para portá-lo para o português,
> será necessário pedir permissão para o autor.
>
> :D
>
> --
> João Batista Neto
> Desenvolvedor engenheiro de aplicações web
>
>
> 2014-04-11 16:27 GMT-03:00 Marco Túlio Pires <mtrpires em gmail.com>:
>
>> Desculpem o cross-post, mas isso pode interessar muita gente,
>> principalmente quem trabalha com/gosta de escrever.
>>
>> Já viram o http://www.hemingwayapp.com/ ?
>>
>> O nome do app é uma alusão ao jornalista que tinha um texto considerado
>> "claro e arrojado". *Na teoria*, o app deixaria o seu texto assim também.
>>
>> É uma brincadeira, mas uma brincadeira que tem fundos de verdade.
>>
>> A ideia é usar algumas das características marcantes do texto de
>> Hemingway e ver se o seu texto é assim. Frases curtas, palavras pequenas,
>> verbos fortes (em vez de advérbios), ausência da voz passiva etc.
>>
>> Nesse sentido, o app te mostra onde estão as frases grandes, os
>> advérbios, as palavras grandes e as frases que usam a voz passiva e você
>> pode tentar substituir e reescrever com o objetivo de deixar seu texto mais
>> claro.
>>
>> A cereja do bolo, ainda na linha da brincadeira, é um medidor que mostra
>> qual o grau de instrução mínimo que a pessoa deveria ter para entender seu
>> texto. A recomendação do site é que seu texto atinja um score de 10 ou
>> menos (algo como uma pessoa do primeiro ano do ensino médio conseguiria ler
>> seu texto sem problemas). O cálculo, pelo que entendi, é feito a partir do
>> número de frases, parágrafos e palavras.
>>
>> Claro que escrever um bom texto não passa apenas pelas características
>> trabalhadas no app, mas é um exercício bem legal pra tentar nos disciplinar
>> a fazer escolhas mais "claras e arrojadas".
>>
>> O único problema é que o app só funciona em inglês :(
>>
>> Abraços,
>>
>> --
>> Marco Túlio Pires :: journogeek :: @mtrpires
>>
>> _______________________________________________
>> escoladedados mailing list
>> escoladedados em lists.okfn.org
>> https://lists.okfn.org/mailman/listinfo/escoladedados
>>
>>
>
> _______________________________________________
> okfn-br mailing list
> okfn-br em lists.okfn.org
> https://lists.okfn.org/mailman/listinfo/okfn-br
> Unsubscribe: https://lists.okfn.org/mailman/options/okfn-br
>
>
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://lists.okfn.org/pipermail/okfn-br/attachments/20140411/9eba28fc/attachment-0005.html>


Mais detalhes sobre a lista de discussão okfn-br