- Mitglied seit
- 06.12.2000
- Beiträge
- 5.486
- Reaktionen
- 0
Hey,
ich brauche für ein lustiges Seminar einen Datensatz, den ich sekundäranalytisch mit ner bestimmten Methode auswerten darf. Dafür suche ich Datenbanken mit kostenlosen Datensätzen, die - wenn man sie zitiert - benutzt und ausgewertet werden können. Einfach um ein paar Methoden zu testen etc.
Quasi sowas wie das UC Irvine Machine Learning Repository - denke da gibt es noch hunderte solcher Archive im Netz in Englisch oder Deutsch...
http://archive.ics.uci.edu/ml/
Sonderliche Ansprüche an die Daten habe ich nicht. Wenn es Datenbanken sind, kann man ja eh suchen. Z.B. bringen mir time-series Daten oder hierarchische Daten (wenn nicht genügend Cluster) wenig. Ansonsten sollten die Datensätze zumindest teilweise wenigstens um die 500 Beobachtungen haben. Alles andere suche ich mir schon dann selbst. Thematisch ist irgendwas ökonomisches oder psychologisches, politisches oder sonstwas i.O. Aber auch ausgefallenere Sachen wie Autopreise oder Weinqualität oder sonstwas kann ganz witzig sein.
Ich weiß, dass R z.B. mit vielen Packages Datensätze mitliefert, aber die sind meistens scheiße bzw. scheiße dokumentiert. Selbst generieren ist übrigens leider auch nicht t_t.
Falls jemand paar gute Links hat, würde ich mich da sehr freuen...
Thx schonmal
BBW
ich brauche für ein lustiges Seminar einen Datensatz, den ich sekundäranalytisch mit ner bestimmten Methode auswerten darf. Dafür suche ich Datenbanken mit kostenlosen Datensätzen, die - wenn man sie zitiert - benutzt und ausgewertet werden können. Einfach um ein paar Methoden zu testen etc.
Quasi sowas wie das UC Irvine Machine Learning Repository - denke da gibt es noch hunderte solcher Archive im Netz in Englisch oder Deutsch...
http://archive.ics.uci.edu/ml/
Sonderliche Ansprüche an die Daten habe ich nicht. Wenn es Datenbanken sind, kann man ja eh suchen. Z.B. bringen mir time-series Daten oder hierarchische Daten (wenn nicht genügend Cluster) wenig. Ansonsten sollten die Datensätze zumindest teilweise wenigstens um die 500 Beobachtungen haben. Alles andere suche ich mir schon dann selbst. Thematisch ist irgendwas ökonomisches oder psychologisches, politisches oder sonstwas i.O. Aber auch ausgefallenere Sachen wie Autopreise oder Weinqualität oder sonstwas kann ganz witzig sein.
Ich weiß, dass R z.B. mit vielen Packages Datensätze mitliefert, aber die sind meistens scheiße bzw. scheiße dokumentiert. Selbst generieren ist übrigens leider auch nicht t_t.
Falls jemand paar gute Links hat, würde ich mich da sehr freuen...
Thx schonmal
BBW