[Okfn-ru] Анонс проекта: Публичные доходы - база деклараций чиновников и депутатов в России

Ivan Begtin ibegtin at gmail.com
Wed Mar 21 07:50:06 UTC 2012


Коллеги,

Пришла пора озвучить еще один новый проект которым мы  занимались в прошлом
году и немного даже в этом. Это проект - Публичные доходы или
publicprofit.ru <http://www.publicprofit.ru/>

Что это такое?

Проект "Публичные доходы" - это база публичных деклараций чиновников и
депутатов Российской Федерации раскрываемых согласно требованиям
российского законодательства. Проект включает каталог опубликованных
источников и базу деклараций доступную для поиска и навигации.

<http://www.publicprofit.ru/>

Ну а если совсем уж по простому.

Уже 3 года в России чиновники публикуют декларации. Вернее ведомства
публикуют выписки из их деклараций, но все в разных формах и документах. Мы
собрали если не все, то очень многие из документов и все что можно было
обработать автоматически - обработали. Всего получилось что-то около 50
тысяч деклараций.

Задача технически была очень непростой, было написано множество парсеров
под разные источники, тщательно структурировались данные по автомобилям,
недвижимости и доходам. Для каждого гражданина и гражданки определялся
автоматически определялся пол, идентифицировалось имущество, где оно
находится и так далее. В общем получилось эдакая очень структурированная
база данных из которой можно делать очень хитрые выборки. В виде этих
выборок и есть множество отчетов на сайте которые Вы уже видите.

Главная проблема с которой мы столкнулись с тем что много некачественных
данных - орфогрфических и порядковых ошибок в цифрах.

Проект делался по заказу ИНСОРа и вчера был озвучен во время представления
их отчета по работе за 4 года. Собственно я бы на него не решился не имея
какой-либо значимой институциональной поддержки, потому как тема деклараций
очень чувствительная, а мы подошли к ней очень плотно дотянувшись до всех
данных которых только можно было. Хотя и идея эта давно уже бродила в
головах, но инициатив пока немного.

На этом же фоне сошлюсь на похожий проект у Трансперенси в России -
http://declarator.org

Чем-то их проект лучше, чем-то лучше наш. У них больше данных с временной
глубиной, у нас шире охват. У них лучше структуризация по ведомствам и
регионам, у нас по структуре имущества и транспортными средствами. В общем
много всего.

Понятно что проекту многого нехватает, в частности нет API, нет дампов
данных, нет многих возможностей которые хотелось бы получить. Скорее всего
все это появится

Если у Вас есть идеи, предложения и мысли что можно добавить/улучшить или
пожелания по интеграции - пишите, постараемся их реализовать
Еще один план - мысль и идея в разработке онтологии финансовой открытости.
Так чтобы эти данные можно было бы сразу интегрировать в Linked Data и
чтобы они, в принципе, могли бы стать предметом научного исследования.

-- 

Best Regards,
  Ivan Begtin

CEO of IDALab (http://www.idalab.ru)

email: ibegtin at gmail.com
twitter: ibegtin <http://twitter.com/ibegtin>
facebook: facebook.com/ibegtin
personal website: ivan.begtin.name
-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://lists.okfn.org/pipermail/okfn-ru/attachments/20120321/be7d1e7c/attachment-0001.html>


More information about the okfn-ru mailing list