In-conference workshops

Analiză de date-Inițiere în limbajul R (Cristian Dan OPARIUC)

“Limbajul R este, alături de Python, unul dintre cele mai puternice și mai populare limbaje specializate în analiza datelor, fiind preferat de majoritatea cercetătorilor din lume, inclusiv de către cei din domeniul socio-uman. Mai mult decât atât, limbajul R este complet gratuit și nu presupune operațiuni complicate de instalare sau activare.

Seminarul „Introducere în limbajul R” nu urmărește tratarea exhaustivă a limbajului – ar fi imposibil – ci reprezintă doar o minimală introducere în mediul R astfel încât participanții să-și formeze o idee privind variantele alternative, gratuite și mult mai puternice în comparație cu aplicațiile comerciale consacrate. În cele 3 ore alocate vom urmări parcurgerea următoarelor teme:

 

  • Prezentarea limbajului R, puterea acestuia și avantajele sale în comparație cu alte programe populare de analiza datelor
  • Obținerea și instalarea limbajului R și a mediului integrat de dezvoltare R Studio, pachetele R, instalarea și actualizarea pachetelor, R Commander, surse de informații privind utilizarea R (activitate practică).
  • Prezentarea interfeței R, conceptele de spațiu de lucru (workspace), proiect, set de date, importul și exportul datelor în și din R, fereastra de date (dataframe),
  • Variabile scalare (vectori) și variabile categoriale (factori) în R, accesarea și modificarea datelor în R, obiecte R, manipularea și vizualizarea datelor și rezultatelor în R.
  • Analize univariate în R. Construirea tabelului de frecvențe în R, reprezentarea grafică a unei distribuții de date.
  • Obținerea indicatorilor tendinței centrale și ai împrăștierii în R, construirea inventarului statistic de bază, analiza distribuției.
  • Analize bivariate în R. Corelații parametrice și neparametrice în R, corelații parțiale și seriale, corelații multiple și analiza consistenței, reprezentări grafice în R.
  • Analiza efectelor în R. Teste pentru diferențe semnificative între medii, teste statistice neparametrice, analiza de varianță unifactorială.
  • Prezentarea generală a pachetului „psych” – Procedures for Psychological, Psychometric and Personality Research
  • Funcții pentru gestiunea datelor și analize descriptive în pachetul „psych”
  • Funcții pentru analiza fidelității, a consistenței și a validității factoriale, analiza de cluster efectuată pe itemi
  • Funcții de analiză a spațiilor de răspuns și a sistemului de cotare
  • Funcții destinate analizei modelelor de răspuns la item, analize Rasch și teoria răspunsului la itemFuncții destinate generării de date. Lucrul cu date simulate folosind pachetul „psych”

Participantul va dobândi deprinderi elementare de lucru în mediul R, va învăța să utilizeze fereastra de comenzi și să-și construiască propriile scripturi, să gestioneze și să purifice datele, să efectueze analize statistice de bază folosind mediul R și să înțeleagă o serie de funcții mai avansate, prezente în pachetele specializate.

Necesar: Videoproiector, ecran de proiecție, conexiune la Internet. Se recomandă ca participanții să dispună de un laptop propriu pentru a lucra exemplele în mod individual”

Data analysis-Introduction to the R language

Cristian –Dan OPARIUC

Beside Python, the R language  is one of the most powerful and popular programming languages for  data analysis.  It is preferred by most researchers in the world, including by those in social sciences.

Moreover, the R language is completely free (open source) and does not involve complicated installation or activation operations.

The “Introduction to R language” seminar does not intended to explain exhaustively this issue.- it would be impossible. It represents only a minimal introduction to the R environment so that participants can gain an initial appreciation of  free and much more powerful alternatives to commercial applications.

In the 3 hours allocated we will discuss the following topics:

  • R language presentation,  its power and its advantages compared to other popular data analysis programs.
  • Obtaining and installing the R language and the integrated development environment R Studio, R packages, installing and updating packages, R Commander, sources of information on R. (practical application).
  • Obtaining and installing the R language and the integrated development environment R Studio, R packages, installing and updating packages, R Commander, sources of R (practical activity) information sources.
  •  Presentation of the R interface and concepts : workspace , project, data set, import and export of data into and from R, dataframe.
  •  Scalar variables  (vectors) and  categorical variables (factors). Accessing and modifying  R  data, R objects, manipulation and visualization of  R data and results .
  • Univariate analysis in R;  table of frequencies,  graphic representation of data distribution.
  •  Obtaining indicators of central tendency , dispersion  , basic  statistical  inventory, distribution analysis.
  • Bivariate analysis in R. Parametric and non-parametric correlations , partial and serial correlations, multiple correlations  internal consistency reliability analysis, graphic representations using R.
  • Effects analysis in R.  Testing significance of the difference between means, non-parametric statistical tests, nonparametric statistical tests, analysis of variance.
  • “Psych”  package – overview  – Procedures for Psychological, Psychometric and Personality Research.
  • Data management functions and descriptive analysis using “psych” package.
  • Functions for  reliability analysis, consistency and validity analysis, cluster analysis performed for items.
  • Functions for responses analysis and scoring system.
  • Functions for item response analysis, Rasch analysis and Item Response Theory (IRT).
  • Functions for generating data. Working with simulated data using the “psych” package.

The participant will acquire basic R-skills, learn to use the command window and build their own scripts, manage and clear the data, perform basic statistical analyzes using the R Studio and understand some advanced,  functions present in specialized packages.

Necessary logistics:

Video projector, internet connection, laptop .

It is recommended that participants have a personal laptop to work individually.

Skip to content