[OKFN-CH] Daten vom Handelsregister und Interessensbindungen der Parlamentarier

Danilo mail at dbrgn.ch
Fri Mar 7 23:26:25 UTC 2014


Hoi zäme

Ich hab früher mal bei Databot gearbeitet: http://databot.ch/ Da haben
wir auch so SHAB/Zefix Parsing gemacht. Ohne Proxies und andere
Techniken wird man ziemlich schnell geblockt.

Interessant ist auch der Fakt dass jeder Kanton ein eigenes Zefix hat.
Da gibt es 2 oder 3 unterschiedliche Systeme im Betrieb, die
unterschiedlichen Output generieren. Und das zT mit kleinen
Unterschieden. Das kann man nicht einfach mit einem einzelnen Parser
parsen.

Eines der Projekte war damals ein Parlamentarier-Feed. Dieser ist
anscheinend hier noch aufrufbar:

http://databot.ch/feeds/parlamentarier.rss

Und hier wird er in einen Twitterfeed gedumpt:

https://twitter.com/parlament_SHAB

Ich weiss nicht ob der Parser aktuell noch läuft (letzte Notification
ist von Ende 2013). Zudem ist die Liste der Parlamentarier nicht mehr
aktuell (wird ca 1-jährig sein). Und das Matching der Parlamentarier
mussten wir damals semi-manuell machen, via Name-Matching über die
Parlament-API.

Eindeutig identifizieren lassen sich Personen im SHAB / HR nicht.
Personen haben keine Identifikation abgesehen von der Name/Heimatort
Kombination. Und diese Kombination kann u.U. auch mehrere Personen
treffen.

Falls ihr Interesse an den Daten oder an einem aktualisierten Feed habt,
müsstet ihr mal den Geschäftsführer kontaktieren. Ist aber schon
ziemlich viel Code der dahinter steckt, das kann man nicht mal einfach
so in ein paar Tagen machen. Deshalb will er die Daten wohl nicht gratis
rausgeben, ausser man macht irgend einen Deal. Aber Nachfragen kostet
nichts :)

Gruss
Danilo

Am Fr, 7. Mär 2014, um 23:27, schrieb reto:
> >An den letztjährigen Hacknights in Zürich wurde Ähnliches probiert.
> >Hier findet ihr Links zur Visualisierung und zum Projektwiki:
> >
> http://data.stadt-zuerich.ch/content/portal/de/index/ogd/aktuell/events/hacknights-2013/projekte/branchen-infos-zueri.html
> 
> Der Code zum Zefix Scraping von dem Projekt befindet sich übrigens hier:
> https://github.com/branchen-infos-zh/zefix
> 
> Ich habe mir das eine Weile angeschaut. Es eignet sich in der Form aber
> nicht wirklich für die Sammlung flächendeckender Daten da es über einen
> Suchbegriff die CH Nummern abfragt. Was man zuerst bräuchte sind alle CH
> Nummern der Schweiz. Ich habe da wenigstens eine Methode gefunden die
> Nummern einzelner politischer Gemeinden zu laden. Das geht noch relativ
> fix
> so dass man bald einen ganzen Kanton zusammen hat.
> 
> Will man dann aber die Daten selber holen (XML über die CH Nummer), dann
> kommt man mit dem oben genannten Code auch nicht weit, da man anscheinend
> geblockt wird wenn man zu viele Queries macht: "The zefix server might
> block your ip if you query to much data. Bulk queries are not supported.
> This is especially true, when fetching xmls with zefxml.sh."
> 
> Hier muss man dann wieder tricksen und Anfragen von verschiedenen IPs aus
> machen. Grundsätzlich liesse sich so allmählich das ganze Register holen.
> Die Frage ist dann aber wohl was passiert, wenn auch diese Bemühungen
> registriert werden. Ich nehme an die Zefix Betreiber werden dann nicht
> einfach weiter zuschauen. Die Situation ist also nicht gut. Kann man die
> Daten eigentlich im Bulk kaufen oder ist das auch nicht möglich?
> 
> Gruss,
> Reto
> _______________________________________________
> okfn-ch mailing list
> okfn-ch at lists.okfn.org
> https://lists.okfn.org/mailman/listinfo/okfn-ch
> Unsubscribe: https://lists.okfn.org/mailman/options/okfn-ch



More information about the okfn-ch mailing list