tag:blogger.com,1999:blog-9206316841515586969.post5834541167839934222..comments2024-03-08T05:26:36.314-03:00Comments on Blog do Leo Monasterio: Dois pacotes essenciais para ansiosos que precisam ler 50 milhões de observações no RLeo Monasteriohttp://www.blogger.com/profile/16334177264659706806noreply@blogger.comBlogger2125tag:blogger.com,1999:blog-9206316841515586969.post-33343074802722194132015-09-28T15:59:07.426-03:002015-09-28T15:59:07.426-03:00Valeu!
Eu não sabia que a diferença era tão grande...Valeu!<br />Eu não sabia que a diferença era tão grande. Agora vou ter que trocar tudo (ou quase) de dplyr para data.table... Ó vida, ó dor.<br />Leo Monasteriohttps://www.blogger.com/profile/16334177264659706806noreply@blogger.comtag:blogger.com,1999:blog-9206316841515586969.post-41427840890700327912015-09-28T07:32:00.998-03:002015-09-28T07:32:00.998-03:00Esse benchmark dah uma idea de quantas milhoes de ...Esse benchmark dah uma idea de quantas milhoes de vezes o fread() eh mais rapido que os concorrentes. :) https://rpubs.com/dpastoor/benchmark-nm-read<br /><br />O data.table tem um sintaxe simples e eh de longe o pacote mais rapido para tudo que eh tipo de manipulacao da base de dados (criar variave, recodificar, filtrar, merge, etc).<br /><br />Um tutorial legal aqui: http://blog.yhathq.com/posts/fast-summary-statistics-with-data-dot-table.htmlRafael H M Pereirahttps://www.blogger.com/profile/06300384365846434244noreply@blogger.com