Есть два отличных пакета для работы с данными в R — dplyr
и data.table
. У каждого пакета свои сильные стороны. dplyr
элегантнее и похож на естественный язык, в то время как data.table
лаконичный, с его помощью многое можно сделать всего в одну строку. Более того, в некоторых случаях data.table
быстрее (сравнительный анализ доступен здесь), и это может определить выбор, если есть ограничения по памяти или производительности. Сравнение dplyr
и data.table
можно также почитать на Stack Overflow и Quora.
Здесь можно найти руководство и краткое описание data.table
, а здесь — для dplyr
. Также можно почитать обучающие материалы по dplyr
на DataScience+.
Читать полностью »