【PythonとSparkで始めるデータマネジメント入門】 ビッグデータレイクのためのテーブルデータ品質管理入門



【PythonとSparkで始めるデータマネジメント入門】 ビッグデータレイクのためのテーブルデータ品質管理入門

Rating 0 out of 5 (0 ratings in Udemy)


What you'll learn
  • データレイク(データ基盤)のデータ分析に含まれる多くのアクティビティのうちの一つデータ品質管理について学べます
  • データの沼化を防ぐためのデータ品質管理について学びます
  • データ品質取得のためのPython(PySpark)ブログラムを学びます
  • データ品質を通した組織の改善プロセスを学びます

Description

現役のデータエンジニアがレクチャーします!


AIや機械学習を行う際に最も時間のかかる作業は、データの準備とそれらの管理です。これらの作業のことをデータエンジニアリングと呼びます。実に80%以上の時間をデータエンジニアリング(データサイエンスのための前処理やメタデータ管理)に割いてるのが現状です。

本コースではSparkを使ったデータエンジニアリングにおけるデータ品質管理について学びます。


データ品質を担保しなければデータ組織のデータ活用の生産性低下は免れません。

本コースを受講してデータを管理するという新たな方向へと舵を切りましょう。


データ品質管理とは、 …

Duration 1 Hours 58 Minutes
Paid

Self paced

Beginner Level

Japanese

2

Rating 0 out of 5 (0 ratings in Udemy)

Go to the Course
We have partnered with providers to bring you collection of courses, When you buy through links on our site, we may earn an affiliate commission from provider.