Coding, Datenbank, R Language

Die Macht des R-Scripting - keine Angst vor Code

R ist eine Programmiersprache für statistische Analysen und Datenoperationen, die auf den ersten Blick entmutigend erscheinen mag, die aber wirklich überzeugend und elegant ist, wenn man sich erst einmal daran gewöhnt hat, und die einem das Leben so viel leichter machen kann. Hier sind die Eindrücke eines Neulings.

06 MIN

R ist nichts für mich, oder?

Ich dachte immer, R sei nur für Statistik-Nerds und nicht für Analysen in der "normalen" UX-Forschung zu verwenden. Aber dann war ich gezwungen, es in einem neueren Projekt zu verwenden, und seine Kraft und Eleganz beeindruckten mich.

Wie bin ich zu R gekommen? Wir haben für einen unserer Kunden ein Dashboard mit verschiedenen UX-KPIs für eine Reihe von Produkten erstellt. Das Das Dashboard wurde in Microsoft PowerBI erstellt, das großartige Datenvisualisierungstools bietet und es dem Benutzer ermöglicht, mit wenigen Klicks benutzerdefinierte Analysen zu erstellen. Aber es ist nicht gut für Statistiken geeignet und verlässt sich stattdessen auf die R-Integration.

 

Warum R? Einige Beispiele

Ein paar Beispiele, die die Verwendung von R so angenehm machen:

  • Typische Vorgehensweisen sind super einfach: Die Berechnung eines KPI aus mehreren Spalten pro Teilnehmer ist ein einzeiliges Verfahren, da R Daten als Vektoren behandelt new_value <- rowMeans(...)
  • Die Durchführung verschiedener statistischer Tests in Abhängigkeit von den Eigenschaften der Daten (z.B. Stichprobenumfang, Verteilung) ist sehr einfach: Schreiben Sie Ihre eigene Funktion if (Dateneigenschaft = X) return (statistischer Test Y) und verwenden Sie sie in Ihrem gesamten Code. Die Arbeit mit größeren Datensätzen ist sehr bequem, da Sie mit der "Teilmenge"-Funktion Teilmengen von Daten on the fly verwenden können.
  • Die Datentransformation ist schnell und leistungsstark: Konvertieren Sie Daten von langen in breite, differenzierende Einzelmessungen, mit einer Funktion namens "dcast".
  • All dies ist auch in SPSS möglich, aber es würde eine Menge Klicken durch Dialoge und Assistenten erfordern. Für jemanden wie mich, der kein großer SPSS-Syntaxprofi ist, war es überraschend, wie einfach es in R war.

 

Die Macht der Gemeinschaft

Aber natürlich bedeutete das Erlernen von R eine Menge Fragen - es ist nicht etwas, das man an einem Nachmittag lernt.

R hat jedoch eine so große und hilfsbereite Community, dass es fast immer eine Antwort gibt. Es gibt zahlreiche Seiten, die Ihnen die Grundlagen der Verwendung von R erklären, und immer, wenn ich ein spezifischeres Problem hatte, fand ich die Lösung fast immer in einer der vielen aktiven Online-Communities. R zu lernen mag ein bisschen schwierig sein, aber Sie sind definitiv nicht allein.

 

Pakete für jede Gelegenheit

Die Lösungen, die Sie online finden, verwenden oft so genannte Pakete, mit denen Sie die Funktionen von R erweitern können. Und da R Open Source ist, gibt es Pakete für fast jede Gelegenheit, die von der Community erstellt und verifiziert wurden.

 

 

 

R kurz und bündig

R ist eine unter der GNU-Lizenz frei verwendbare Programmiersprache, die mit einem breiten Satz statistischer Funktionen ausgestattet ist und mit Hilfe von Paketen, die von der Community zur Verfügung gestellt werden, fast unendlich erweitert werden kann. Entwicklungsumgebungen wie RStudio machen das Leben sehr viel einfacher.

Mein Vorschlag: Holen Sie sich RStudio, besorgen Sie sich echte Daten, mit denen Sie arbeiten können (um zielloses Herumspielen zu verhindern), schauen Sie sich die Tutorial-Seiten an und: haben Sie etwas Geduld!

Hier finden Sie RStudio und Tutorials:

 

Ist R das Richtige für mich?

Plus

  • R-Code ist anderen Programmiersprachen recht ähnlich, wenn Sie sich also vorher ein wenig im Codieren versucht haben, ist er vielleicht leichter zu verstehen als die SPSS-Syntax (war für mich).
  • Wenn Sie erst einmal den Dreh raus haben, sind Analysen superschnell erledigt und der Code kann später optimiert und wiederverwendet werden.
  • Die grafische Ausgabe soll leistungsfähiger und anpassbarer sein als SPSS (noch nicht getestet).
  • Es macht eine gewisse Freude, komplexe Datenoperationen und statistische Analysen mit ein paar Zeilen eleganten Codes durchzuführen - zumindest für mich.
  • Es ist kostenlos!

Minus

  • Keine grafische Benutzeroberfläche, schwieriger zu erlernen, da Sie programmieren müssen

 

Fazit

Ich hätte wahrscheinlich nicht mit R angefangen, wenn ich nicht von PowerBI  "gezwungen" worden wäre. Aber im Nachhinein bin ich froh, dass ich es getan habe!

Wenn Sie SPSS besitzen, werden Sie R nicht für einen schnellen Mittelwert oder statistischen Test verwenden. Wenn Sie jedoch wissen, dass Sie umfangreichere Datentransformationen und -analysen durchführen werden, und diese möglicherweise wiederholt durchführen, könnte es sich lohnen, sich mit R zu befassen. Besonders wenn SPSS das, was Sie zu tun versuchen, unnötig komplex zu machen scheint. Ich werde R definitiv für zukünftige Projekte verwenden.

Autor

Simon Harder

Simon ist seit 2011 UX-Experte, nachdem er seine Diplomarbeit in Psychologie über die Entwicklung des UX-Score-Messinstruments abgeschlossen hatte. Seitdem hat er für SirValUse und GfK gearbeitet, bis er 2018 uintent mitgründete. Als UX-Consultant hat er viele internationale Projekte durchgeführt, darunter mehrere Feldphasen in China. Er leitete auch mehrere summative Studien zur quantitativen Messung der User Experience von HMIs. Darunter waren auch eine Reihe von Automotive-Studien, z. B. mit aufgabenbasierten Interviews oder Okklusionstests. Bei uintent konzentriert sich Simon auf UX-Forschung, qualitativ und quantitativ.

Zurück