データサイエンスのための前処理入門PythonとSparkで学ぶビッグデータエンジニアリング(PySpark) 速習講座

Rating 4.39 out of 5 (38 ratings in Udemy)
What you'll learn
- データサイエンスのための前処理について学習することができます
- PySparkを使ったデータ基盤におけるデータエンジニアリング
- ケーススタディで実務を例に取ったデータエンジニアリングの流れで紹介
- PySparkを使う上でハマりやすいチューニングポイントを知ることができます
- 分散処理の基本を学ぶことができます
Description
現役のデータエンジニアがレクチャーします!
AIや機械学習を行う際に最も時間のかかる作業は、データの準備とそれらの管理です。これらの作業のことをデータエンジニアリングと呼びます。実に80%以上の時間をデータエンジニアリング(データサイエンスのための前処理など)に割いてるのが現状です。
本コースではApache Sparkを使ったデータエンジニアリングについて学びます。
ポイント:
本コースでは分散処理のデファクトとなりつつあるSparkについて学びます。
Apache Sparkはビッグデータ処理で多く使われている分散処理エンジ …
Duration 2 Hours 58 Minutes
Paid
Self paced
Beginner Level
Japanese
273
Rating 4.39 out of 5 (38 ratings in Udemy)
Go to the Course
We have partnered with providers to bring you collection of courses, When you buy through links on our site, we may earn an affiliate commission from provider.
Paid
Self paced
Beginner Level
Japanese
273
Rating 4.39 out of 5 (38 ratings in Udemy)
Go to the Course