Ir para conteúdo
  • Main
  • Feed do blog

lyamada-tech blog

Tag: pandas

Escrito por Luis Yamadadezembro 21, 2021

Pandas on Spark

https://towardsdatascience.com/run-pandas-as-fast-as-spark-f5eefe780c45

Escrito por Luis Yamadanovembro 11, 2021

AWS Timestream Use Case: Stock Prices + AWS Data Wrangler

https://betterprogramming.pub/deep-dive-into-amazon-timestream-data-ingestion-in-python-18c6c09accd

Escrito por Luis Yamadanovembro 10, 2021

An interesting comparisson of apply / map / applymap in Pandas

https://towardsdatascience.com/apply-vs-map-vs-applymap-pandas-529acdf6d744

Escrito por Luis Yamadanovembro 3, 2021

Data analysis with Mito

https://towardsdatascience.com/how-to-analyze-data-using-mito-in-python-4bf817092367

Escrito por Luis Yamadaagosto 31, 2020

gluestick: ETL lib para Python

Rival do petl? Talvez. Bora testar 🙂 Artigo original de encontro com a lib: https://towardsdatascience.com/how-to-write-etl-operations-in-python-baffbceeadf4 Documentação da Lib: https://github.com/hotgluexyz/gluestick

Escrito por Luis Yamadaagosto 31, 2020

Dicas para lidar com diferentes volumes de dados (c/ Python)

https://towardsdatascience.com/17-strategies-for-dealing-with-data-big-data-and-even-bigger-data-283426c7d260

Escrito por Luis Yamadaagosto 27, 2020

Paralelizando leitura de arquivos – Pandas

Escrito por Luis Yamadaagosto 24, 2020

Benchmark de performances de diferentes formatos de arquivos vs Pandas

Tabela de comparação: Artigos de comparação de performance sobre velocidades de leitura e escrita, consumo de memória, compressão, etc.: https://towardsdatascience.com/stop-persisting-pandas-data-frames-in-csvs-f369a6440af5 https://towardsdatascience.com/the-best-format-to-save-pandas-data-414dca023e0d

Escrito por Luis Yamadaagosto 23, 2020

Cython + datatype declaration = SPEEEEEED

https://levelup.gitconnected.com/this-one-trick-can-make-your-code-17-times-more-efficient-e65769006dfa

Escrito por Luis Yamadajunho 6, 2020

Vaex – 1 bilhão de rows? We can do it

https://towardsdatascience.com/how-to-process-a-dataframe-with-billions-of-rows-in-seconds-c8212580f447

Escrito por Luis Yamadamaio 28, 2020

Tutoriais – AWS Data Wrangler

https://github.com/awslabs/aws-data-wrangler/tree/master/tutorials

Escrito por Luis Yamadamaio 25, 2020

Python UI – Projeto exemplo

https://towardsdatascience.com/building-a-python-ui-for-comparing-data-13c10693d9e4

Escrito por Luis Yamadamaio 24, 2020maio 24, 2020

Limitação de memória processando grandes Datasets com Pandas? Faça essa POC: QuestDB

A ênfase desta publicação é a experimentação do QuestDB, que está ainda em processo de amadurecimento mas é uma promessa interessante para um banco de dados SQL baseado em time series. Caso você tenha um projeto de análise de dados overtime provenientes de IoT, ou até mesmo construção de um dataset de preços de ações […]

Escrito por Luis Yamadamaio 23, 2020

Data collection for stocks price

Ver no Medium.com

Escrito por Luis Yamadamaio 23, 2020

Python lib: Datatable

Mais um concorrente do Pandas https://towardsdatascience.com/an-overview-of-pythons-datatable-package-5d3a97394ee9

Crie um site ou blog no WordPress.com
Privacidade e cookies: Esse site utiliza cookies. Ao continuar a usar este site, você concorda com seu uso.
Para saber mais, inclusive sobre como controlar os cookies, consulte aqui: Política de cookies
  • Assinar Assinado
    • lyamada.tech.blog
    • Já tem uma conta do WordPress.com? Faça login agora.
    • lyamada.tech.blog
    • Assinar Assinado
    • Registre-se
    • Fazer login
    • Denunciar este conteúdo
    • Visualizar site no Leitor
    • Gerenciar assinaturas
    • Esconder esta barra
Crie um site como este com o WordPress.com
Comece agora