[okfn-bg] Отваряне на административния регистър

Boyan Yurukov yurukov at gmail.com
Mon Jun 11 12:23:50 UTC 2012


Здравейте всички,

В България имаме административен регистър -
http://ar2.government.bg/ras/ Съдържа
данни за всички структури на публичната информация, заедно със законите,
колко са заети там и колко са незаетите места. Структурата на сайта е
отвратителна и не може да се scrape-ва по нормален начин. Питах ги за
данните и ми казаха, че не могат да ми дадат базата си данни, но "скоро"
щели да обновят сайта.

Вчера не успях да спя и най-накрая разбрах каква е структурата на
запитванията. Пуснах един spider/scraper скрипт да обходи всичко и да свали
всички отдели, министерства и прочие. Свали 16555 преди малко. Споделих
всички документи, заедно с индексиращата база данни тук:
http://opendata.yurukov.net/pubadminreg/

Това още са само HTML документи и в тях е заключена ценната информация за
структурата. Проблемът отново ще е да се намери общ модел на визуализация,
за да може да се изкарат въпросните данни и да се оформят в отворен формат.
Тъй като това ще отнеме време, реших да споделя всички документи за който
му се занимава междувременно.

Когато всичко е готово и индексирано, мисля да го визуализирам с някои от
тези библиотеки. Втората ми харесва най-много, но не знам как ще се справи
с 16000 node-а. Дано да има динамично зареждане.
http://mbostock.github.com/d3/talk/20111116/pack-hierarchy.html
http://thejit.org/static/v20/Jit/Examples/RGraph/example1.html
http://mbostock.github.com/d3/talk/20111018/cluster.html
http://mbostock.github.com/d3/talk/20111116/force-collapsible.html

Приемам мнения и идеи. Погледнете и другите данни дето съм отворил до сега:
http://opendata.yurukov.net <http://opendata.yurukov.net/pubadminreg/>

Боян


-- 
________________________

Boyan Yurukov
Twitter: yurukov
http://yurukov.net/blog
http://lipsva.com
http://crime.bg
-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://lists.okfn.org/pipermail/okfn-bg/attachments/20120611/66c50402/attachment.html>


More information about the okfn-bg mailing list