<p><strong>Tidyverse</strong> ist ein Paket, dass mehrere Pakete beinhaltet, die alle nach ähnlicher Syntax funktionieren und untereinander kompatibel sind.</p>
<p>Es bietet somit einen sehr großen Funktionsumfang und wird daher auch viel genutzt.</p>
<p><strong>tidyr</strong> beinhaltet eine Grammatik, um Datensätze in ein <em>tidy</em> Format zu bringen. Ziel ist es, dass jede Spalte eine Variable ist, jede Zeile eine Beobachtung und jede Zelle einen Wert beinhaltet. Hier gibt es das <ahref="https://github.com/rstudio/cheatsheets/blob/master/data-import.pdf">Cheat-Sheet</a> zu <code>tidyr</code>.</p>
</div>
<divclass="flex-picture">
<divclass="figure">
<imgsrc="pics/tidyr.png"width="300"alt=""/>
<pclass="caption">stringr</p>
</div>
</div>
<divclass="flex-text">
<p><strong>dplyr</strong> beinhaltet eine Grammatik, um Datenmanipulationen zu machen. Es besticht dabei durch seine Einfachheit und der Kombinationsmöglichkeit der Grundbefehle. Für eine erste Dateneinsicht ist dies meist hilfreich zu nutzen, oder um die Daten umzustrukturieren (manipulieren). Hier gibt es das <ahref="https://github.com/rstudio/cheatsheets/blob/master/data-transformation.pdf">Cheat-Sheet</a>.</p>
</div>
<divclass="flex-picture">
<divclass="figure">
<imgsrc="pics/dplyr.png"width="300"alt=""/>
<pclass="caption">dplyr</p>
</div>
</div>
<divclass="flex-text">
<p><strong>ggplot2</strong> ist <strong>das</strong> Grafikpaket in R. Es bietet die Möglichkeit Grafiken genauestens den eigenen Präferenzen anzupassen und darzustellen. Dazu gibt es viele Erweiterungspakete, die ebenfalls auf der Syntax von <strong>ggplot2</strong> aufbauen. Hier gibt es das <ahref="https://github.com/rstudio/cheatsheets/blob/master/data-visualization-2.1.pdf">Cheat-Sheet</a>.</p>
</div>
<divclass="flex-picture">
<divclass="figure">
<imgsrc="pics/ggplot2.png"width="300"alt=""/>
<pclass="caption">ggplot2</p>
</div>
</div>
<divclass="flex-text">
<p><strong>stringr</strong> ist ein Paket um <code>string</code>-Variablen vernünftig in R bearbeiten zu können. Es gibt einige Alternativen, aber dennoch bleibt <strong>stringr</strong> ein beliebtes Paket zur Bearbeitung von <code>string</code>-Variablen. Insbesondere bei Textanalysen muss man im Vorfeld die <code>string</code>-Variablen bearbeiten. Hier gibt es das <ahref="https://github.com/rstudio/cheatsheets/blob/master/strings.pdf">Cheat-Sheet</a>.</p>
<p>Es geht in diesem kurzen 1-Tages-Kurs vor allem um <strong>Readbility-Skills</strong>. Ziel ist es, dass man neue Probleme mit dem hier gezeigten lösen kann. Dafür sollte der Inhalt aber während des Workshops gut aufbereitet bzw. nachbereitet werden (eigene Notizen in den Skripten etc.).</p>
<p>In meinen Kursen gilt immer folgendes Prinzip: <strong>Was man nicht schreibt, lernt man auch nicht!</strong></p>
<p>Es ist also eine didaktische Entscheidung von mir, dass es keine fertige Skripts gibt. Selbst programmieren heißt eben auch selbst Code schreiben und nicht nur einzelnen Felder austauschen (wie bei Click and Play mit SPSS). Ebenso wird meiner Meinung nach das Verständnis von Funktionen viel besser vermittelt.</p>
<p>Die Slides bzw. HTML-Dokumente haben aber kopierbaren Code (ein bisschen Erleichterung). Wenn man in diesen Dokumenten über den Code geht, erscheint oben rechts ein <em>Clipboard</em>, mit dem man den Code in die Zwischenablage kopiert.</p>
<li>Interesse daran, anderen zu helfen/zu unterstützen</li>
<li>in der Ansprache ziehe ich das Du vor</li>
<li>Kurz-Inputs und dann eigenes <em>trial-and-error</em></li>
<li>Unterstützung beim Code-Crashing</li>
<li>gebe Input, aktive Mitarbeit aber erforderlich</li>
</ol>
<ulclass="incremental">
<li>alle Kursmaterialien sind entweder auf <ahref="https://gitlab.com/bpkleer/mtg-21-tidyverse">gitlab</a> oder in der <ahref="https://rstudio.cloud/spaces/146374/join?access_code=xfg7axLLy1bVgItjpH869s1Jg3Lmd9ajntRdEKMH">R Studio Cloud</a> runterzuladen. In <ahref="https://ilias.uni-giessen.de/ilias/goto.php?target=grp_247939&client_id=JLUG">ILIAS</a> finden sich Links an die betreffenden Stellen.</li>
<p>Arbeiten mit R heißt in der Regel immer wieder auf Probleme zu stoßen und willens zu sein, diese Probleme zu lösen. In meiner jetzt fast zehnjährigen Arbeit mit R bin ich noch nie auf ein Problem gestoßen, dass man nicht lösen konnte (auch wenn es manchmal umständlich war).</p>
<p><strong>Wichtig dafür:</strong> Lesefähigkeit von Code. Also das Verständnis von Code. Dies ist auch das primäre Ziel des heutigen Tages.</p>
<p>Wie gesagt, sind die Kursmaterialien direkt in der <ahref="https://rstudio.cloud/spaces/146374/join?access_code=xfg7axLLy1bVgItjpH869s1Jg3Lmd9ajntRdEKMH">RStudio Cloud</a> verlinkt, aber auch in <ahref="https://gitlab.com/bpkleer/mtg-21-tidyverse">gitlab</a>.</p>
<p>Die <code>code chunks</code> haben ein integriertes <em>Clipboard</em>, mit dem der Code direkt in ein R Skript kopiert werden kann. Dafür geht man einfach beim betreffenden Code oben rechts auf das <em>Clipboard</em>-Zeichen.</p>
<p><strong>Wichtig</strong>: Bei den HTML-Präsentationen führt ein Mausklick immer zur nächsten Slide. Dies einfach deaktiveren, in dem man die Taste <code>k</code> drückt. Dann kann man in Ruhe den Code kopieren und mit den Pfeiltasten durch die Slide navigieren. In den HTML-Dokumenten am Nachmittag kann man einfach klicken, da es keine Präsentationen mehr sind.</p>
<p><strong>Weitere Shortcuts für die Präsentationen:</strong></p>
<p><code>b</code>, <code>></code>, <code>+</code>: Text wird größer</p>
<p><code>s</code>, <code><</code>, <code>-</code>: Text wird kleiner</p>
<p><code>f</code>: Fußzeile zeigen/verstecken</p>
<p><code>c</code>, <code>t</code>: Inhaltsverzeichnis (springen auf andere Seite möglich)</p>
<spanid="cb3-2"><ahref="#cb3-2"aria-hidden="true"tabindex="-1"></a> mean <spanclass="ot">=</span><spanclass="fu">sum</span>(x) <spanclass="sc">/</span><spanclass="fu">length</span>(x)</span>
<p>Wie im ersten Fall bereits sichtbar, trenne ich Argumente mit <code>Enter</code> (Zeilenumbruch) und setze Klammern ebenfalls in neue Zeilen. Das hat den Vorteil, dass die Kommentierung einfacher erfolgen kann. Hat eine Funktion nur ein einziges Argument bleibt die Klammer in der gleichen Zeile.</p>
<spanid="cb4-6"><ahref="#cb4-6"aria-hidden="true"tabindex="-1"></a><spanclass="sc">-</span><spanclass="dv">20</span>, <spanclass="co"># Beginn 20. Buchstaben vom Ende</span></span>
<spanid="cb4-7"><ahref="#cb4-7"aria-hidden="true"tabindex="-1"></a><spanclass="sc">-</span><spanclass="dv">2</span><spanclass="co"># vorletzter Buchstabe vom Ende</span></span>
<p>Der Kurs setzt Grundkenntnisse voraus. Ihr lernt euch jetzt in Breakout-Rooms kennen. In den Breakout-Rooms sollt ihr euch kennenlernen und ein paar Grundaufgaben in R lösen. Dies dient auch der Auffrischung. Ich schaue abwechselnd in den Breakout-Rooms nach. Ihr könnte mich aber auch rufen.</p>
<li>Schafft eine neue Variable, die dem Datensatz hinzugefügt werden soll. Diese Variable soll <code>socgroup</code> heißen und einfach eine Sequenz von <code>1, 2, 3, 4</code> über die Länge des Datensatzes beinhalten. <strong>Wichtig</strong>: Jede Zahl soll gleich oft vorkommen. Ob sich die Sequenz immer wiederholt (also Reihenfolge <code>1, 2, 3, 4, 1, 2, 3, 4, ...</code>), oder ihr erst alle <code>1</code>, dann alle <code>2</code> etc. abbildet, ist euch überlassen.</li>
<p>Wenn jemand nicht seine lokale R-Installation nutzen möchte, kann er einfach auf die <strong>RStudio Cloud</strong> zurückgreifen. Dort sind die Datensätze, Skripte & Folien auch bereits hinterlegt und müssen nicht direkt runtergeladen werden.</p>