[okfn-br] CSV com os salários da USP

Everton Zanella Alvarenga tom em okfn.org.br
Domingo Novembro 16 23:53:52 UTC 2014


Estou tentando colocar no CSV e, ao trabalhar um pouco nos dados, notei que
há muitos salários com valor nulo ou com valores indicando apenas na
notação decimal. Exemplo, para o Renan Braz aparece 5.8 ao invés de 5800. O
Tableau parece conseguir identificar isso.

É preciso limpar esses dados. Coloque a coluna dos salários em ordem
decrescente e veja as últimas 150 linhas. Dá para ver que tem coisa
estranha aí que precisa ser ajustada, como os salários nulos ou até abaixo
do salário mínimo, alguns casos provavelmente múltiplos de 1000, como o que
citei acima.

Em 16 de novembro de 2014 21:18, Edgar Zanella Alvarenga <e em vaz.io>
escreveu:

> Legal! =)
>> Só acho que há um erro na última linha do código, pq 28272 de 29225 é
>> 96,73%.
>> 90,66% receber 90.66% do dinheiro seria perfeito demais. =P
>>
>
> Valeu, tinha um erro mesmo, tinha feito a porcentam com o valor ao invés
> do número
> de pessoas. Vai demorar alguns minutos pra atualizar o cache do link que
> passei, mas
> os valores corrigidos são:
>
> 96.74% (28272 de 29225) recebem menos de R$24000.00, sendo que eles
> representam 90.66% do custo da USP em salários.
>
> 3.26% (953 de 29225) recebem mais de R$24000.00, sendo que eles
> representam 9.34% do custo da USP em salários.
>
> Edgar
>
>
>
>>> Edgar
>>>
>>> On 16/11/2014 19:07, Andres MRM wrote:
>>>
>>>> Boa!
>>>>
>>>> A USP prometeu abrir esses dados amanhã, não?
>>>> www.usp.br/imprensa/?p=44644K
>>>> Me pergunto como a Folha pode ter aberto hoje...
>>>>
>>>> "Os dados foram antecipados para o jornal Folha de S. Paulo como
>>>> cumprimento
>>>> de determinação judicial, decorrente de processo impetrado pela empresa
>>>> jornalística."
>>>>
>>>> Ah, agora vi.
>>>>
>>>>
>>>> On 16-11-14 18:49, Luiz Augusto wrote:
>>>>
>>>>> Massa!
>>>>>
>>>>> Após os cliques, ele também oferece para download uma "tabela de
>>>>> referência
>>>>> cruzada", de nome de arquivo "tabela-nomes_crosstab.csv", pesando 7Mb.
>>>>>
>>>>> Há algum dado "novo" nessa ou ela foi gerada automaticamente pelo
>>>>> sistema
>>>>> através da "tabela-nomes_data.csv" (de 4mb, espelhada no seu
>>>>> repositório)?
>>>>>
>>>>> PS.: Fuçando, achei também um "salarios-usp.twbx", que é basicamente um
>>>>> .ZIP. Dei umas risadas ao dar de cara com uma subpasta "Data/medalhas".
>>>>> Medalhinha pra quem estoura o teto constitucional? rs (ok, deve ser do
>>>>> modelo que a Folha usou, mas não dava pra perder a piadinha). Os
>>>>> arquivos
>>>>> de dentro desse twbx/ZIP parecem ser XMLs, caso alguém prefira.
>>>>>
>>>>> Luiz
>>>>>
>>>>> 2014-11-16 18:31 GMT-02:00 Edgar Zanella Alvarenga <e em vaz.io>:
>>>>>
>>>>>  Hoje a Folha liberou um infográfico contendo os salários de todos
>>>>>> professores e
>>>>>> funcionários da USP:
>>>>>>
>>>>>> http://www1.folha.uol.com.br/infograficos/2014/11/117724-
>>>>>> ranking-de-salarios-da-usp.shtml
>>>>>>
>>>>>> Para quem quiser os dados em csv que foram utilizados pra gerar esse
>>>>>> infográfico,
>>>>>> deixei disponível aqui (basta clicar em "Raw" pra baixar):
>>>>>>
>>>>>> https://github.com/aivuk/var/blob/master/usp-salarios/
>>>>>> tabela-nomes_data.csv
>>>>>>
>>>>>> A Folha utilizou o software Tableau pros infográficos, e deixaram como
>>>>>> opção de download
>>>>>> apenas como imagem ou pdf apenas do conteúdo que estiver visualizando
>>>>>> na
>>>>>> página.
>>>>>> Após baixar todas as imagens (2239) e gastar um tempinho tentando
>>>>>> fazer
>>>>>> ocr descobri
>>>>>> que se clicasse em algum local do infográfico e depois tentasse
>>>>>> baixar os
>>>>>> dados novamente,
>>>>>> surgia a opção de baixar tudo em um csv. Não sei se é um bug ou
>>>>>> feature,
>>>>>> mas vou considerar
>>>>>> um feature.
>>>>>>
>>>>>> Edgar
>>>>>>
>>>>>>
>>>>>>
>>>>>> _______________________________________________
>>>>>> okfn-br mailing list
>>>>>> okfn-br em lists.okfn.org
>>>>>> https://lists.okfn.org/mailman/listinfo/okfn-br
>>>>>> Unsubscribe: https://lists.okfn.org/mailman/options/okfn-br
>>>>>>
>>>>>>
>>>>  _______________________________________________
>>>>> okfn-br mailing list
>>>>> okfn-br em lists.okfn.org
>>>>> https://lists.okfn.org/mailman/listinfo/okfn-br
>>>>> Unsubscribe: https://lists.okfn.org/mailman/options/okfn-br
>>>>>
>>>>
>>>> _______________________________________________
>>>> okfn-br mailing list
>>>> okfn-br em lists.okfn.org
>>>> https://lists.okfn.org/mailman/listinfo/okfn-br
>>>> Unsubscribe: https://lists.okfn.org/mailman/options/okfn-br
>>>>
>>>
>>> _______________________________________________
>>> okfn-br mailing list
>>> okfn-br em lists.okfn.org
>>> https://lists.okfn.org/mailman/listinfo/okfn-br
>>> Unsubscribe: https://lists.okfn.org/mailman/options/okfn-br
>>>
>> _______________________________________________
>> okfn-br mailing list
>> okfn-br em lists.okfn.org
>> https://lists.okfn.org/mailman/listinfo/okfn-br
>> Unsubscribe: https://lists.okfn.org/mailman/options/okfn-br
>>
>
> _______________________________________________
> okfn-br mailing list
> okfn-br em lists.okfn.org
> https://lists.okfn.org/mailman/listinfo/okfn-br
> Unsubscribe: https://lists.okfn.org/mailman/options/okfn-br
>



-- 
Everton Zanella Alvarenga (also Tom)
Open Knowledge Brasil - Rede pelo Conhecimento Livre
http://br.okfn.org
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://lists.okfn.org/pipermail/okfn-br/attachments/20141116/965fbea3/attachment-0005.html>


Mais detalhes sobre a lista de discussão okfn-br