Tag: pandas
gluestick: ETL lib para Python
Rival do petl? Talvez. Bora testar 🙂 Artigo original de encontro com a lib: https://towardsdatascience.com/how-to-write-etl-operations-in-python-baffbceeadf4 Documentação da Lib: https://github.com/hotgluexyz/gluestick
Benchmark de performances de diferentes formatos de arquivos vs Pandas
Tabela de comparação: Artigos de comparação de performance sobre velocidades de leitura e escrita, consumo de memória, compressão, etc.: https://towardsdatascience.com/stop-persisting-pandas-data-frames-in-csvs-f369a6440af5 https://towardsdatascience.com/the-best-format-to-save-pandas-data-414dca023e0d
Limitação de memória processando grandes Datasets com Pandas? Faça essa POC: QuestDB
A ênfase desta publicação é a experimentação do QuestDB, que está ainda em processo de amadurecimento mas é uma promessa interessante para um banco de dados SQL baseado em time series. Caso você tenha um projeto de análise de dados overtime provenientes de IoT, ou até mesmo construção de um dataset de preços de ações […]
Data collection for stocks price
Ver no Medium.com
Python lib: Datatable
Mais um concorrente do Pandas https://towardsdatascience.com/an-overview-of-pythons-datatable-package-5d3a97394ee9