はだだだだ

定食にサラダは不要だと思う。

MENU

R for Data Science 感想

Rを用いたデータ分析の勉強のために、R for Data Scienceを一通りやりました。著者は「Rの神」こと、Hardley Wickham氏で信頼感は抜群です。

日本語訳の書籍もありますが、英語版が無料で見られるため、英語版でやりました。

https://r4ds.had.co.nz/

感想はこんな感じです。

  • データ分析の大まかな流れを理解できる。
  • tidyverseを中心にしているため、文法の説明に無駄がない。
  • visualisationの説明が多め。
  • 「Rでデータサイエンス」の勉強の一冊目としてはかなりいい。

データ分析の大まかな流れを理解できる。

データ分析プロジェクトのworkflowが意識された構成になっており、バランスがよいと思いました。

データサイエンスというと統計モデルを作ったり、機械学習モデルを組んだりといったイメージが最初に出てきてしまいがちですが、それ以前の前処理の話や、データのvisualisationの重要性を強調しているところが好印象です。

tidyverseを中心にしているため、文法の説明に無駄がない。

この本ではデータの前処理やvisualisationを行う際に、tidyverseの使用を前提にしています。

tidyverseが実務でもよく使われているという実用性に加え、必要に応じてあれこれpackageを使い分けていないので、入門編としては余分な文法の知識を学ばないで済みます。

データの形式についてもtidyverseに合わせるため、data.frameではなく、tibbleにこだわっているところも良い点だと思います。

visualizationについてはggplot一択になっており、見た目の調整でごちゃごちゃになりがちなグラフ作成の文法についてもよくまとまっていると思います。

visualisationの説明が多め

visualisationの重要性が強調されており、グラフ作成のためのggplot2の使い方については3章(Data visualisation)と28章(Graphics for vommunication)で説明がなされています。

さらにモデリングについて説明している23章では、モデルを作成し、理解する工程でもvisualisationが重要だと書いてあります。

You’re only limited by your visualisation skills. 

結果を可視化することは、自分の理解度を上げるだけでなく、人に説明するときにも重要であるため、細かなテクニックの前に、visualisationの重要性を意識付けてくれる構成になっているのは流石だと思いました。

「Rでデータサイエンス」の勉強の一冊目としてはかなりよい

全体の感想としてはかなり良い本だと思います。この本を読むだけでいきなりデータサイエンティストとしての仕事ができるようになるとは思いませんが、最初の一冊としてはかなりよいと思います。

補足

ネットの無料版はR markdownで書かれており、コードも公開されています。

https://github.com/hadley/r4ds

R markdownの書き方の参考にもなると思います。

一点だけ勉強する際に不便だと感じたのが、練習問題の回答がないことです。

しかし、この点については多くの方が自分なりの回答を公開してくれているため、参考になると思います。

特に下の回答例はかなり参考になります。

https://jrnold.github.io/r4ds-exercise-solutions/

他にも「R for data science solutions」などでググれば回答例がたくさんでてきます。

 

以上 

Rではじめるデータサイエンス

Rではじめるデータサイエンス