R言語を使えるようになりたいけど、どうしてよいかわからない。そんな風に悩まれていませんか?
このコースでは手元にある、分析を想定していないデータの前処理(データをきれいにする工程)、つまり「汚い」データの加工から、グラフの作成、集計、レポートの作成までを網羅しています。マスターすれば、色々な表形式のデータに対して適応できる手法を、丁寧に網羅的に、解説し、演習問題を通じて身に着けていきます。
プログラミング経験がない方、私のような医療職、産業保健職を念頭に作成された、ゼロから学べるコースです。
また、重回帰分析、ロジスティック回帰分析、一般化線形モデルなどを、その原理からかみ砕いて、統計学の初歩から丁寧に解説したセクションも付録として収録しています。
-----お知らせ---------
2022年7月7日:改訂版に大幅増強!(内容を8時間→17時間へ。スライドを多数追加)
2022年8月末頃に旧版の内容は削除予定
-----------------------
なぜ前処理なのか?
多くの場合、「データ」として私たちの手元にあるものは、表データです。「エクセル」のデータといえばイメージが付きやすいかもしれません。そして大抵の場合は、表データはそのまま分析するには適さない形になっています。統計学の教科書などでまなぶ手法を適応するためには、現実のデータを統計処理できる形に加工する力が必要です。多くの場合は、エクセル等を利用して力技で形を整えますが、R言語を用いると、その加工が魔法のように簡単にできます。
このコースは、そのように分析に至るまでの最初の工程、「前処理」をテーマに据えたコースとなっています。手元にあるデータを分析したいけど、どうすればよいかわからないという方には、統計処理の前に、あるいは平行して学んでいただきたい内容となっており、手元のデータを分析したいすべての方にとって役に立つ内容となっています。
何故R言語なのか?
R言語は環境構築が比較的簡単で、分析に使えるパッケージが豊富なので、ゼロから学ぶ人でも安心してスタートできますし、着実に力をつけることが出来ます。
私自身、全く知識のないとことから始めましたが、今ではデータの抽出〜分析までが以前の1/100の作業時間で済むようになったので、残った時間を他の業務・研究に充てることが可能になりました。日常疑問に感じることを、気軽にデータを使って語ることができるようになり、日々の業務での自身のスキルアップにもつながっていることを実感しています。Pythonも使いますが、データ前処理、統計解析、レポート作成を行う場合、R言語はかなりお勧めできる言語だと考えています。
レポート作成方法まで学ぶ理由
分析したデータは人の目に触れて(共有されて)はじめて意味を持ちます。また、その情報は受け取る側に取って分かりやすく設計しないと「つまらないレポート」になってしまい、プレゼンテーションが終わった後は2度と読まれることはありません。せっかく手間暇をかけて分析するのですから、導き出した分析結果を効果的に共有し、見るだけのレポートから新しい会話、アイデアを生み出すレポートへと変身させましょう!
改訂版について
こちらのコース、私が一番最初に作成した、「医師が教えるR言語での医療データ分析入門」を、4年間のR言語のバージョンアップに対応したものとなります。また、4年間、コースを受講いただいた3,000人強の受講者の方からいただいた質問や要望に応えて、スライドでの説明を増やし、各関数の演習問題を追加、実際のデータに対してのデータ処理のセクションやデータ集計、時間の取り扱い等、一部中級コースで解説していた内容を、さらにわかりやすくしたうえで、基本コースに統合いたしました。
改定前 → 改定後
収録時間:8時間38分 → 17時間 と2倍にアップ!
Rの基礎(動画22本) → Rの基礎(スライド81枚 動画28本)
インポート(動画11本) → インポート(スライド74枚 動画19本)
可視化(動画24本) → 可視化(スライド97枚 動画27本)
統計とモデリング(動画46本)→ 削除(付録として収録)
データ加工(動画42本) → データ加工(スライド184枚 動画80本)
ーーー → (新規)実際のデータの加工(動画9本)
ーーー → (新規)データ集計(スライド126枚 動画37本)
レポート(動画4本) → レポート(スライド37枚 動画20本)
ーーー → 付録:統計とモデリング(動画46本)
改訂前は、「基礎→グラフ→クリーニング→統計モデリング→レポート」という内容でしたが、こちらは、「基礎→グラフ→クリーニング→集計→レポート→(付録:統計モデリング)」と、改訂前のコースでいくつかご意見をいただいた内容を参考に、より初心者にわかりやすく、学びやすく、最後まで理解できて進めると私が考えた形で内容を提供しています。
(付録として、改訂前の統計モデリングのセクションの内容をまるまるつけています。統計セクションについては、「他のセクションと比較して難解すぎる」とコメントをいくつかいただいており、独立して、もっと丁寧に解説するコースとして公開する予定です。)
動画の時間的にも、改訂前は8時間弱だったものが、改訂版は14時間(+付録3時間)と大幅に、内容と解説の丁寧さをアップしたものとなっています。
本コースだけで、R言語の基礎をまるまる習得できる、そんなコースに仕上がったと考えています。(学び始めたころの自分が一番見たいコースの内容になったと考えています)