R you ready? von Mark Heckmann


Ein Beispiel zum Schnelleinstieg

In diesem Kapitel werden Sie Schritt für Schritt dazu angeleitet, eine Analyse beispielhaft mit R durchzuführen. Es geht hier noch nicht darum, die einzelnen Schritte, Befehle oder alle berechneten Statistiken zu verstehen. Sie sollen hier lediglich einen Eindruck davon bekommen, wo die Reise Sie hinführen wird und wie der Umgang mit R sich anfühlt.

Das Einzige, was sie vorab hierzu erledigen müssen, ist R zu installieren. Laden Sie hierzu die R-Software von der Seite http://www.r.project.org. herunter und installieren sie diese. Eine ausführliche Anleitung zur Installation findet sich in Kapitel 2.

Um eine Analyse durchzuführen, benötigen wir Daten. Üblicherweise werden Sie dazu eigene Datensätze in R einlesen und verwenden, dazu (Kap. ). Alternativ können zu Übungszwecken auch Daten genutzt werden, die bereits in der R Software implementiert sind und so direkt genutzt werden können. Im Folgenden wird einer dieser Datensätze mit dem Namen genutzt.

Der Datensatz soll exploriert werden. Hierzu wird zunächst die Verteilung der einzelnen Variablen betrachtet. Im Anschluss werden diverse Regressionen gerechnet. Geben Sie folgende Befehle Schritt für Schritt in R ein und schauen Sie, was passiert. Der Text hinter der Raute () sind Kommentare, die nicht mit eingegeben werden müssen.

    ?attitude                           # Infos zum Datensatz 
     
    names(attitude)                     # Variablennamen anzeigen  
    head(attitude)                      # Die ersten Zeilen 
    attitude                            # Gesamten Datensatz ausgeben
 
 
    # Explorative Datenanalyse ###
    
    pairs(attitude)                     # Scatterplots aller Variablen
    cor(attitude)                       # Korrelation aller Variablen
    
    attach(attitude)                    # Datensatz verknüpfen 
                   
    qqnorm(rating)                      # QQ-Diagramm von "rating" 
    qqline(rating)                      # Gerade hinzufügen
    shapiro.test(rating)                # Test auf Normalverteilung 
    
    qqnorm(complaints)                  # QQ-Diagramm von "rating" 
    qqline(complaints)                  # Gerade hinzufügen
    shapiro.test(complaints)            # Test auf Normalverteilung 
           
    
    # Regressionen rechnen #
    
    m <- lm(rating ~ complaints)        # Regression von "rating" 
                                        # auf "complaints" 
    summary(m)                          # Ergebnisse der Regression
    plot(complaints, rating)            # Scatterplot
    abline(m, col="blue")               # Regressiongrade
    
    par(mfrow = c(2, 2))                # 2x2 Grafiken auf eine Seite
    plot(m)                             # Regressionsdiagnostik 
    
    g <- lm(rating ~ ., data=attitude)  # Alle Variablen aufnehmen
    step(g)                             # Schrittweise Regression 
    
    detach(attitude)                    # Speicher aufräumen    

Damit haben Sie ihre erste R Session abgeschlossen. Sie sollte einen Eindruck davon vermitteln, wie das Arbeiten mit R aussehen kann. In den Folgenden Kapiteln werden die einzelnen Befehle und deren Logik ausführlich besprochen.