[Offenes-Parlament] ETL / Testen / Verwenden für andere Parlamente

Carsten Senger senger at rehfisch.de
Wed Jul 25 20:26:03 UTC 2012


Hallo,

ich experimentiere gerade mit offenesparlament und habe einige
Fragen dazu:

* Der ETL-Prozess dauert sehr lange. Kann man den für Tests
  abzukürzen und z.B. nur einen Teil der Dokumente laden?

* Die Extrakt-Schritte laden die Daten von der Bundestagsseite
  herunter und werten sie direkt aus. Machte es nicht Sinn, diese
  als Rohdaten lokal zu speichern, um sich nicht bei einer
  Codeänderung neu herunterzuladen?  Ähnliches gilt für das Laden
  der Transkripte. Diese werden im transform-Schritt
  heruntergeladen und direkt mit den Personendaten verknüpft.

* Gibt es einen Dump der Daten.
  http://offenesparlament.de/pages/qualitaet verlinkt auf
  http://webstore.thedatahub.org/pudo/parlament.db. Den Host gibt
  es nicht mehr. Verwende ich dafür webstore.openspending.org
  bekomme ich eine 200 OK / Content-Type application/x-sqlite3,
  aber leider 0 Byte groß.

* Ich überlege, offenesparlament für den Hessischen Landtag zu
  verwenden. Die ETL-Schritte muss natürlich neu geschrieben
  werden. Die Modelle sehen soweit gut aus. Spricht etwas
  dagegen, offenesparlament dafür zu verwenden?


Viele Grüße,

..Carsten


-------------- next part --------------
A non-text attachment was scrubbed...
Name: signature.asc
Type: application/pgp-signature
Size: 490 bytes
Desc: OpenPGP digital signature
URL: <http://lists.okfn.org/pipermail/offenes-parlament/attachments/20120725/28d734c9/attachment.sig>


More information about the offenes-parlament mailing list