[Okfn-ru] Анонс проекта: Публичные доходы - база деклараций чиновников и депутатов в России
Ivan Begtin
ibegtin at gmail.com
Wed Mar 21 07:50:06 UTC 2012
Коллеги,
Пришла пора озвучить еще один новый проект которым мы занимались в прошлом
году и немного даже в этом. Это проект - Публичные доходы или
publicprofit.ru <http://www.publicprofit.ru/>
Что это такое?
Проект "Публичные доходы" - это база публичных деклараций чиновников и
депутатов Российской Федерации раскрываемых согласно требованиям
российского законодательства. Проект включает каталог опубликованных
источников и базу деклараций доступную для поиска и навигации.
<http://www.publicprofit.ru/>
Ну а если совсем уж по простому.
Уже 3 года в России чиновники публикуют декларации. Вернее ведомства
публикуют выписки из их деклараций, но все в разных формах и документах. Мы
собрали если не все, то очень многие из документов и все что можно было
обработать автоматически - обработали. Всего получилось что-то около 50
тысяч деклараций.
Задача технически была очень непростой, было написано множество парсеров
под разные источники, тщательно структурировались данные по автомобилям,
недвижимости и доходам. Для каждого гражданина и гражданки определялся
автоматически определялся пол, идентифицировалось имущество, где оно
находится и так далее. В общем получилось эдакая очень структурированная
база данных из которой можно делать очень хитрые выборки. В виде этих
выборок и есть множество отчетов на сайте которые Вы уже видите.
Главная проблема с которой мы столкнулись с тем что много некачественных
данных - орфогрфических и порядковых ошибок в цифрах.
Проект делался по заказу ИНСОРа и вчера был озвучен во время представления
их отчета по работе за 4 года. Собственно я бы на него не решился не имея
какой-либо значимой институциональной поддержки, потому как тема деклараций
очень чувствительная, а мы подошли к ней очень плотно дотянувшись до всех
данных которых только можно было. Хотя и идея эта давно уже бродила в
головах, но инициатив пока немного.
На этом же фоне сошлюсь на похожий проект у Трансперенси в России -
http://declarator.org
Чем-то их проект лучше, чем-то лучше наш. У них больше данных с временной
глубиной, у нас шире охват. У них лучше структуризация по ведомствам и
регионам, у нас по структуре имущества и транспортными средствами. В общем
много всего.
Понятно что проекту многого нехватает, в частности нет API, нет дампов
данных, нет многих возможностей которые хотелось бы получить. Скорее всего
все это появится
Если у Вас есть идеи, предложения и мысли что можно добавить/улучшить или
пожелания по интеграции - пишите, постараемся их реализовать
Еще один план - мысль и идея в разработке онтологии финансовой открытости.
Так чтобы эти данные можно было бы сразу интегрировать в Linked Data и
чтобы они, в принципе, могли бы стать предметом научного исследования.
--
Best Regards,
Ivan Begtin
CEO of IDALab (http://www.idalab.ru)
email: ibegtin at gmail.com
twitter: ibegtin <http://twitter.com/ibegtin>
facebook: facebook.com/ibegtin
personal website: ivan.begtin.name
-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://lists.okfn.org/pipermail/okfn-ru/attachments/20120321/be7d1e7c/attachment-0001.html>
More information about the okfn-ru
mailing list