データサイエンスのためのストリーミング前処理入門 PythonとSparkで始めるビッグデータストリーミング処理入門

Rating 4.57 out of 5 (7 ratings in Udemy)
What you'll learn
- PySparkを使ったビッグデータストリーミング処理を学びます
- メッセージキュー(今回はApache Kafkaを使います)とストリーミング処理エンジン(Pyspark)の組み合わせを学びたい方
- Avroフォーマットなどストリーミングの開発に頻繁に使われるフォーマットについて学びます
- ケーススタディで実務を例に取ったデータエンジニアリングの流れで紹介
- データサイエンスのためのストリーミングにおける前処理について学習することができます
Description
現役のデータエンジニアがレクチャーします!
AIや機械学習を行う際に最も時間のかかる作業は、データの準備とそれらの管理です。これらの作業のことをデータエンジニアリングと呼びます。実に80%以上の時間をデータエンジニアリング(データサイエンスのための前処理や仕組み構築)に割いてるのが現状です。
本コースではApache Sparkを使ったストリーミングのデータエンジニアリングについて学びます。
ポイン …
Duration 2 Hours 58 Minutes
Paid
Self paced
Beginner Level
Japanese
99
Rating 4.57 out of 5 (7 ratings in Udemy)
Go to the Course
We have partnered with providers to bring you collection of courses, When you buy through links on our site, we may earn an affiliate commission from provider.
Paid
Self paced
Beginner Level
Japanese
99
Rating 4.57 out of 5 (7 ratings in Udemy)
Go to the Course