Escrito por Luis Yamadaagosto 24, 2020 Estratégia para UPDATE de alta volumetria de dados no Lake (object store, não DW)
Escrito por Luis Yamadamaio 28, 2020 Tutoriais – AWS Data Wrangler https://github.com/awslabs/aws-data-wrangler/tree/master/tutorials
Escrito por Luis Yamadamaio 24, 2020maio 24, 2020 2 serverless data lakes com AWS https://towardsdatascience.com/a-complete-guide-on-serverless-data-lake-using-aws-glue-athena-and-quicksight-3a8a24cfa4af
Escrito por Luis Yamadamaio 22, 2020maio 23, 2020 Pyspark running over Docker – Sentiment Analysis https://towardsdatascience.com/when-your-docker-meets-pyspark-to-do-sentiment-analysis-of-10-gb-customer-review-data-part-1-277633d39bba
Escrito por Luis Yamadamaio 22, 2020maio 23, 2020 Spark with Kubernetes https://towardsdatascience.com/apache-spark-with-kubernetes-and-fast-s3-access-27e64eb14e0f