Die Entscheidung, in ein anderes Land auszuwandern oder ein Erasmus-Semester im Ausland zu verbringen, ist wohl eine der aufregendsten und zugleich herausforderndsten Entscheidungen im Leben. Doch welches europäische Land passt am besten zu deiner Persönlichkeit, deinen Werten sowie deinen Einstellungen und Vorlieben? Genau hier setzt DestinAItion an. Mithilfe eines datenbasierten Vorhersagemodells analysieren wir deine individuellen Präferenzen und empfehlen die drei geeignetsten europäischen Länder für deine zukünftige Reise – sei es für ein Auslandssemester oder das Auswandern.
Methodik
Datenerhebung
Um eine aussagekräftige Empfehlung abgeben zu können, brauchten wir zunächst einen passenden Datensatz. Diesen fanden wir im „ESS Data Portal“ mit der European Social Survey aus dem Jahr 2020. Er beinhaltete Daten von über 45.000 Teilnehmenden aus 29 europäischen Ländern und zahlreiche Variablen, die wir anschließend analysierten und die für unsere Zwecke interessantesten Variablen auswählten. Die 21 ausgewählten Einstellungs-Items lauten wie folgt:
Vertrauen in das europäische Parlament
Die meisten Menschen versuchen, dich auszunutzen, oder versuchen, fair zu sein
Den meisten Menschen kann man trauen, oder man kann nicht vorsichtig genug sein
Die meiste Zeit sind die Menschen hilfsbereit oder sie kümmern sich hauptsächlich um sich selbst
Platzierung im linken oder rechten politischen Spektrum
Stärke der emotionalen Verbundenheit mit Europa
Zufriedenheit mit dem Leben als Ganzes
Wie glücklich ist man generell
Wie oft trifft man sich privat mit Freunden, Verwandten oder Kollegen
Wie wichtig ist es, Freunden gegenüber loyal zu sein und sich den Menschen zu widmen, die einem nahe stehen
Wie wichtig ist es, eine gute Zeit zu haben
Wie wichtig ist es, in einer sicheren Umgebung zu leben
Wie wichtig ist es, Menschen zu helfen und sich um das Wohlergehen anderer zu kümmern
Wie wichtig ist es, Spaß und Dinge zu suchen, die Freude bereiten
Wie wichtig ist es, andere Menschen zu verstehen
Wie wichtig ist es, sich korrekt zu verhalten
Wie wichtig ist es, Traditionen und Bräuche einzuhalten
Wie wichtig ist es, von anderen respektiert zu werden
Man plant für die Zukunft oder nimmt jeden Tag, wie er kommt
Zugehörigkeit zu einer Religion
Boykott einiger Produkte in den letzten 12 Monaten
Die folgenden 29 Länder waren im Datensatz vertreten und haben wir demnach einbezogen: Österreich, Belgien, Bulgarien, Schweiz, Zypern, Tschechien, Deutschland, Dänemark, Estland, Spanien, Finnland, Frankreich, Großbritannien, Kroatien, Ungarn, Irland, Island, Italien, Litauen, Lettland, Montenegro, Niederlande, Norwegen, Polen, Portugal, Serbien, Schweden, Slowenien, Slowakei
Datenverarbeitung & Modellierung
Nach dem Verkleinern des Datensatzes standardisierten wir die verbliebenen Variablen. Dabei nutzten wir die Z-Standardisierung. Im nächsten Schritt entwickelten wir ein Modell mit Python in Google Colab, das die Person anhand ihrer eingegebenen Werte dem eigenen Land zuordnet. Man sieht in der Confusion Matrix [siehe Screenshot], dass unser Modell ziemlich gut die Personen aus den jeweiligen Ländern auch als solche erkennt und zuordnet. In den Fällen, in denen eine Fehlklassifikation aufgetreten ist, wurde die Person häufig einem Nachbarland zugewiesen. Nach der Testung verschiedener Algorithmen (Random Forest Classification und XGBoost mit den Hyperparametern n_estimators, max_depth, min_samples_split und min_samples_leaf) haben wir uns für den XGBoost Algorithmus ohne Hyperparameter-Tuning entschieden, da dieser die höchste Genauigkeit (35%) aufwies. Eine Vorhersage mit dem XGBoost inkl. Grid Search der vier Hyperparameter ergab keine Verbesserung der Vorhersagegenauigkeit.
Das XGModell haben wir im Anschluss abgespeichert und war dann bereit, auf neue Daten angewendet zu werden.
Länder-Vorhersage
Das Interface bauten wir mit Streamlit. Wir clusterten die Einstellungs-Items nach Kategorien, wie zum Beispiel Soziale Kontakte & Beziehungen, Religion & Weltanschauung sowie Mentalität & Werte. Nach der Eingabe und Klicken auf einen Ergebnisbutton werden die drei Länder mit der höchsten Übereinstimmung ausgegeben - als Auflistung, mit Prozentwerten und visualisiert auf einer Europakarte. Bei der Vorhersage wird das Land, das man als Herkunftsland angibt, nun jedoch übersprungen und nicht wie bei der Modellerstellung vorhergesagt.
Screenshot aus unserer App:
Ergebnisse & Learning
Unser Ergebnis ist ein funktionierendes Interface, auf der man seine individuellen Präferenzen angeben kann und danach eine Auswahl aus 3 Ländern empfohlen bekommt, die auf einer Europa-Karte angezeigt werden.
Learnings
Ohne Zweifel wäre es auch sinnvoll, noch weitere Länder (nicht nur europäische Länder) in die Vorhersage einzubeziehen. Dazu lagen jedoch keine vollständigen Daten vor, weshalb wir uns dann nur auf Länder innerhalb Europas beschränkten. Uns ist auch bewusst, dass die Entscheidung, in welches Land man reist bzw. auswandert, nicht nur von den abgefragten Variablen abhängt, sondern da zum Beispiel auch Dinge wie Sprache, Gesundheitsversorgung, Jobmöglichkeiten oder Wetter/Temperaturen mit hineinspielen. Diese haben wir jedoch nicht mit einbezogen, da bei uns der Fokus auf der Zuordnung nach persönlichen Werten und Einstellungen liegen sollte.
Ein weiterer interessanter Aspekt, der über unser Modell hinausgeht, ist die Frage, inwiefern es bereichernd sein kann, sich bewusst für ein Land zu entscheiden, in dem die Werte von den eigenen abweichen. Besonders für ein Auslandssemester könnte eine solche Erfahrung wertvoll sein, da sie zur persönlichen Weiterentwicklung und interkulturellen Kompetenz beiträgt. Diese Überlegung haben wir nicht verfolgt, könnte aber im zukünftigen Projekt interessant sein.
Quellen & Datenbank
Datensatz: https://www.europeansocialsurvey.org/
Streamlit: https://docs.streamlit.io/develop/api-reference
Bilder: https://de.cleanpng.com/png-gmygjp/download-png.html
Link zum Projekt
Ländervorhersage: https://destinaition.streamlit.app/
Code bei GitHub: https://github.com/DestinAItion/DestinAItion_Europa
Team & Rollen
Alina Eichhorn
In alle Schritte des Projekts eingebunden.
Annemarie Müller
In alle Schritte des Projekts eingebunden.
Isabelle Hagemeier
In alle Schritte des Projekts eingebunden.
Veronika Gandeva
In alle Schritte des Projekts eingebunden.
Mentor:in
Hendrik Linn