[okfn-bg] data on the last Bulgarian Parliament
Boyan Yurukov
yurukov at gmail.com
Thu Apr 18 17:17:16 UTC 2013
Както писах в twitter, през юни ще започна наново проекта за парламента.
Махнали са част от адресите и документите в сайта на НС и това чупи
scraping-а. Ще оправя тъкмо моделът в базата данни и ще добавя още няколко
неща, които липсват.
б
On Apr 15, 2013 2:14 PM, "Stefan Krastanov" <krastanov.stefan at gmail.com>
wrote:
> > Графиките изглеждат интересно. В блога ми преди две години бях направил
> > подобна статистика за съпричастност на депутатите към гласуването
> партиите
> > им в рамките на три поредни сесии. Интересно е обаче да се види като
> граф с
> > такъв алгоритъм.
>
> Въпросния граф много го харесвам, но както е направен сега има няколко
> проблема свързани с коректност: има три параметъра които съм настроил
> "почти на ръка" (горна граница на отсъствията, долна граница мярката
> на съгласуваност и брой "nearest neighbors"). Когато намеря време ще
> направя слайдери за тези параметри и ще известя на листа отново.
>
> > Dataset-а на парламента, който пуснах, имаше недостатъци в data модела
> тъй
> > като го изграждах постепенно докато учех какви са данните и как работи
> > парламента.
>
> Областа която покривам е доста по-малка, така че за мен беше много
> по-лесно (и пак не гарантирам че sql-а е добре нормализиран -
> използвах възможно по-точни datatypes и constraints, но нямам сериозно
> образование по въпроса). Това което е по-специално е че от време на
> време предупреждавам информационния център за грешки на сайта им и
> след около месец те ги поправят.
>
> > Определено ще ми е интересно да видя още графики от теб. Препоръчвам ти
> да
> > разгледаш crossfilter.js на Square. Доста добре работи с
> многодименционални
> > данни.
>
> Това ще ми е полезна библиотека. Имам професионален опит с неща като
> matlab/numpy, но те са полезни за лабораторни данни, не толкова за
> datamining и статистика, още по-малко за визуализации. Предполагам че
> си личи от графиките, че библиотеките които ползвам не са най-добрия
> избор.
>
> > Нещо друго, което обсъждаме отдавна е индексиране на всички
> > предложения и закони и crowdsource-ване на категоризирането им
> > (про-социални, популистки, реформистки, про-ес, про-русия, лобистки и
> т.н.
> > етикети). Това и гласуването ще помогне да се направи профил на всеки
> > депутат в каква насока гласува, дали е принципен или се върти според
> > партията. Това ще даде много повече информация за характера на депутата.
> > Данните на практика са налице - свалят се всички проектозакони и гласове
> > всяка седмица. Трябва само да се направи един добър frontend и да се
> > crowdsource-ва категориите.
>
> Идеята ми харесва много. Кой знае, след няколко месеца може даже да
> почна да работя по нея.
>
> Благодаря за идеите и насоките. Ще следя мейлинг листа и блоговете, и
> ще се обаждам ако имам с какво да помогна.
>
> Стефан
>
-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://lists.okfn.org/pipermail/okfn-bg/attachments/20130418/8f1f06d8/attachment.html>
More information about the okfn-bg
mailing list