• Liebe User, bitte beachtet folgendes Thema: Was im Forum passiert, bleibt im Forum! Danke!
  • Hallo Gemeinde! Das Problem leidet zurzeit unter technischen Problemen. Wir sind da dran, aber das Zeitkontingent ist begrenzt. In der Zwischenzeit dürfte den meisten aufgefallen sein, dass das Erstellen von Posts funktioniert, auch wenn das Forum erstmal eine Fehlermeldung wirft. Um unseren Löschaufwand zu minimieren, bitten wir euch darum, nicht mehrmals auf 'Post Reply' zu klicken, da das zur Mehrfachposts führt. Grußworte.

Gesucht: Tabelle Vorwahl --> Bundesland

Mitglied seit
30.07.2000
Beiträge
4.626
Reaktionen
71
Hi,
ich hab hier gerade eine Doktorarbeit, bei der ich den Rücklauf der verschickten Fragebögen pro Bundesland analysieren will. Die Fragebögen wurden alle per Fax verschickt aus einer bestehenden Datenbank -- die Datenbank enthält aber nur die Nummern.

Kurz und knapp: Ich konnte per Google keine Tabelle finden, bei der ich eine Vorwahl direkt einem Bundesland zuordnen konnte. Alles, was ich finden konnte, ist eine Suchmaschine, in der ich erst eine Vorwahl eingeben kann und eine PLZ ausgespuckt bekomme, und dann mit der PLZ das Bundesland rausfinden kann.
Da es im Datensatz mehrere tausend Nummern aus fast allen Vorwahl-Bereichen gibt, ist eine manuelle Eingabe so gut wie nicht zu bewältigen.

also, wäre super wenn da jemand besser im Suchen ist als ich!
 
Mitglied seit
30.07.2000
Beiträge
4.626
Reaktionen
71
Die Website geht bei mir nicht (timeouts), aber ich kann eh keine Scripts für sowas schreiben.

Eine funktionierende Website für Ort -> Bundesland ist übrigens http://www.deutschland-adressen.de/Orte.php
Aber wie gesagt: Das alles manuell einzugeben wären viele Stunden Arbeit, die die Diss-Schreiberin lieber nicht hätte.
 

bog

Mitglied seit
02.08.2002
Beiträge
10.121
Reaktionen
0
Ort
auf dem mutterschiff
und wie, wenn ich fragen darf, gedenkst du dann diese tausenden eintraege mit einem bundesland zu versehen, wenn du zwar zum einen keine sample-datenbank zur verfuegung stellst, zum anderen aber sagst, dass du ohnehin kein script schreiben kannst?
waere halt mal interessant zu wissen welches format du als ausgabe erwartest, anders kann man dir nicht so direkt helfen, fuerchte ich.

edit: hab aus langeweile maln script gebastelt, das aus einer datei im format "vorwahl1\nvorwahl2\nvorwahl3\n..." die staedtenamen mit hilfe der vorher von mir verlinkten vorwahlen-orts-datenbank und aus diesen dann mit der von dir verlinkten suchmaschine die bundeslaender herausparsed; also mehr oder weniger genau das tut, was du verlangst. fragt sich halt echt noch, in welchem format du die ausgabe willst.
 
Mitglied seit
30.07.2000
Beiträge
4.626
Reaktionen
71
Sehr cool!

Ausgabeformat... öh, excel? :ugly: Meinetwegen auch Nur-Text.
Benutzt wird es hinterher in SPSS, das ist ein Standard-Statistikprogramm, das die Fälle (Versuchspersonen) in den Zeilen hat und die Variablen in den Spalten (Vorwahl, PLZ, Bundesland,...).

Eine einfache Text-/Excel-Liste mit allen Vorwahlen-Bundesland-Kombinationen könnte ich da einfach so einpflegen, das es zu der (schon eingetragenen) Vorwahl das dazugehörige Bundesland in eine neue Spalte einträgt.
 

bog

Mitglied seit
02.08.2002
Beiträge
10.121
Reaktionen
0
Ort
auf dem mutterschiff
ja gut, laesst sich ja beliebig anpassen. kannst du mit php-scripts umgehen?
wenn du von tausenden von datensaetzen redest vermute ich mal ne vergleichsweise lange laufzeit des scripts, d.h. es waere wohl clever, das script von der kommandozeile aus laufen zu lassen. als ausgabe wuerde ich jetzt halt mal ne csv-datei (-> excel) mit den vorwahlen in spalte 1 und den dazugehoerigen bundeslaendern in spalte 2 vorschlagen/implementieren.
wenn du willst kannst du mir auch den vorwahlen-datensatz (am besten ne text-datei in der die vorwahlen in der gewuenschten reihenfolge aufgelistet sind) schicken und ich lass das teil drueberlaufen.
choose now!
 
Mitglied seit
30.07.2000
Beiträge
4.626
Reaktionen
71
Vielen Dank! Ich hab den Datensatz gerade nicht hier, müsste aber in ner halben Stunde drankommen. Ich schick dir dann nen Link. Viieelen Dank schonmal!


Edit: Der Mensch, der den ganzen Datensatz hat, ist heute nicht zu erreichen. Eine komplette Liste aller Vorwahlen (in dem Format wie du es geschrieben hast, zwei Spalten Vorwahl+Bundesland, csv, wäre also super!!
 

bog

Mitglied seit
02.08.2002
Beiträge
10.121
Reaktionen
0
Ort
auf dem mutterschiff
nungut, dann lass ich das teil mal durchlaufen. was ich vielleicht noch erwaehnen muss, ist, dass wohl (schaetzungsweise) ne fehlerquote von 10-15% drin ist; d.h. der anteil der gesamten vorwahlendatenbank wird kein bundesland bekommen. das liegt daran, dass die ortsnamen in der datenbank des bundesamtes teilweise recht uneindeutig angegeben sind, weiterhin auch daran, dass die suchmaschine da einige staedte (sagen wir mal doerfer/gemeinden) gar nicht kennt. beispiel ist "klettendorf" mit der vorwahl 036336, das in der suchdatenbank gar nicht vorhanden ist. du kannst da also beten, dass aus solchen kaeffern keiner der datensatzmenschen kommt :-P.
ein weiteres problem ist uebrigens, dass excel ein wenig eigen mit csvs umgeht; d.h. wenn du eine csv-datei mit "04342" als inhalt einer zelle oeffnest, zeigt er einfach die null nicht an, weil er denkt, er stellt eine ganze zahl dar. im texteditor sind diese nullen jedoch vorhanden.
das ding laeuft momentan noch durch, leider begrenzt der webserver augenscheinlich die geschwindigkeit, sobald ein paar requests durch sind, sonst ginge das um den faktor 3-4 schneller. ich poste dann die ergebnisliste.
 

bog

Mitglied seit
02.08.2002
Beiträge
10.121
Reaktionen
0
Ort
auf dem mutterschiff
jo ist durch nun. von 5204 vorwahlen hat er zu 678 kein bundesland zuordnen koennen. das sind knapp 13%.

im anhang ist die liste als .txt, einfach in .csv umbenennen.
 
Mitglied seit
30.07.2000
Beiträge
4.626
Reaktionen
71
Vielen, vielen Dank!!
Wenn ich dir irgendwann mal den favor returnen kann (z.B. Hardwareberatung), sag bescheid!
 
Mitglied seit
30.07.2000
Beiträge
4.626
Reaktionen
71
Ich muss nochmal nachhaken. Da sind nämlich Fehler...
Aufgefallen ist es mir z.B. bei Münster (0251) und Umgebung (z.B. Münster-Nienberge, 02533). Beides ist mit BaWü angegeben, liegt aber natürlich in NRW.
Kannst du dir das erklären?
 

bog

Mitglied seit
02.08.2002
Beiträge
10.121
Reaktionen
0
Ort
auf dem mutterschiff
http://www.deutschland-adressen.de/...lz=&kfz=&AdvSearch=AdvSearch&submit=Suchen%21

... 8[

alleine mit dem genauen namen gibt es drei verschiedene muensters in deutschland. das script sollte eigentlich die erste uebereinstimmung, in diesem fall hessen ausgeben, weiss nicht genau weshalb das anders lief.

ich schreibe das script mal um, fand gerade die suchseite hier: http://www.staedte-datenbank.de/suche.php

da muss man nicht den umweg ueber den stadtnamen nehmen. hab grad was aufm herd stehen, kann also ne halbe stunde dauern.
 

bog

Mitglied seit
02.08.2002
Beiträge
10.121
Reaktionen
0
Ort
auf dem mutterschiff
so, das resultat gefaellt mir schon besser. man hat nun keine fehler mehr aufgrund ambiguoser staedtenamen, dafuer aber gibt es offensichtlich auch vorwahlen, die fuer mehrere bundeslaender gelten. aufgefallen ist mir das z.b. an der 030; die gilt fuer berlin, gleichermassen aber auch fuer bezirke von brandenburg. da eine brandenburgische stadt mit a anfangend als erstes resultat in der suche auftaucht, vergibt das script die 030 an brandenburg.
der server laesst auch mehr daten durch; das ganze laeuft also schneller.
zuweisungsabdeckung der vorwahlen liegt bei 91,5%, also ein stueckweit besser als bei der anderen methode. schaus dir mal an.
 
Mitglied seit
19.05.2003
Beiträge
19.993
Reaktionen
849
Lustig, dass ich gerade auch nutzen kann, Danke für die zip codes mit den Geodaten. Wie genau sind die separated, dass ich die gut in R einlesen kann? Excel trennt es zwar irgendwie, aber mach dann aus der letzten Spalte ein Datum.

read.table("de.txt", sep="\t")

hats wohl getan.. sieht zumindest so aus.
 
Zuletzt bearbeitet:
Oben