データ分析のおすすめ本を紹介!企業が求めるデータ分析スキルを学ぶ

こんにちは、たくろー(@takuro_data )です!

企業が求めるデータ分析スキルを独学するための、おすすめ本を紹介ます!

LINE、メルカリ、楽天、DeNAデータアナリスト求人の応募要件で、独学できるスキルです。

  • 優先度 高:SQL、BI、アクセス解析、統計基礎知識
  • 優先度 低:Python/Rを用いた統計解析・機械学習、A/Bテスト、ビックデータ、マーケティング知識
データ分析を独学する!企業が求めるデータアナリストスキル

優先度 高のおすすめ本を紹介し、番外編で優先度 低や業務知識のおすすめ本を紹介します。

おすすめ本一覧

おすすめ本購入カテゴリレベルおすすめポイント
AmazonSQL初級分析をしてビジネスに役立てたい非エンジニア向けに書かれている
AmazonSQL中級データ分析実務で使えるSQLコードがケース別にまとめられている
AmazonBI初級色やグラフの使い分けなどの見せ方だけでなく、メッセージや主張を伝えたい相手に興味を持ってもらう考え方が身に付く
AmazonBI初級Tableauの基本が一通り理解して使えるようになる
Amazonアクセス解析初級アクセス解析(ウェブ解析)の技術だけでなく、ビジネスに活かすことが学べる
Amazonアクセス解析初級ストーリーで気軽にGoogle Analytics4を学べる
Amazon統計基礎知識初級統計学を、図表やイラストが豊富で図鑑のようにパラパラとめぐるだけで気軽に学べる
Amazonデータ分析一般データという手段よりも、課題が何なのか、データを使う目的が大事だと考えられるようなる
Amazonデータ分析一般KPIマネジメントの目的を達成するための、KPI設定方法が参考になる
Amazonデータ分析一般データ分析に使う数理モデルを網羅的に知ることができる
Amazon統計モデリング中級数理モデルの中でも、データ分析実務でよく使う統計モデルについて、理解が深まる
Amazon機械学習中級機械学習を、道具としてビジネスでどう活かすか理解できる
Amazonデータ分析基盤中級大量のデータ分析を可能にしている、データ分析基盤について理解できる

SQL(データ抽出)

分析をしてビジネスに役立てたい非エンジニア(本書ではプランナー)向けに書かれていることから、おすすめします!

本書の内容が、プランナーとエンジニア双方の共通言語として働くことが、意図されています。データ分析実務で、エンジニアの方に、データ関連で問い合わせることが多々あるので、SQLでデータ抽出するのはもちろん、データ分析基盤について、エンジニア視点での知識を持つことは重要です。

第1部でPostgreSQL(SQLの一種)を実行することで、データ分析に必要なSQLを一通り身につき、第2部を読み、データ分析基盤の知識を理解できます。アクセスログ分析のSQLも学べるのも、おすすめポイントです。

データ分析実務で使えるSQLコードがケース別にまとめられていることから、おすすめします!

本書は、著書が普段の業務で実際に作成しているレポートやSQLのコードをより汎用化して、レシピ集としてまとめられています。「売上を把握するためのデータ抽出」「ユーザーを把握するためのデータ抽出」「Webサイトでの行動を把握するためのデータ抽出」の章は、SQLでデータ抽出してレポーティングまで、そのままデータ分析実務でも活用できます。

はじめから順番に読み進めて、網羅的に学ぶのもいいのですが、気になる課題に関連するところから、実際に手を動かしながら学んでいくのがよいかと思います。様々な種類のSQLコードに対応しているのも、おすすめポイントです。

BI(データ可視化)

データ可視化やダッシュボード作成は、誰の役に立つのか。色やグラフの使い分けなどの見せ方だけでなく、メッセージや主張を伝えたい相手(本書では、オーディエンス)に興味を持ってもらう考え方が身に付くことから、おすすめします!

本書では、著者の実務経験を元に、データ視覚化(可視化)のノウハウ・アンチパターン・ベストプラクティクスが、具体的な事例で説明されています。エグゼクティブダッシュボード、デジタルマーケティングダッシュボードなど、実務で参考にできる実例があり、作成の思考プロセスも学ぶことができます。

実務で、継続的に使われるダッシュボードを作成するために、第5章の「オーディエンスを意識する」「ダッシュボードの深層部分」は必読です。ダッシュボード例は、Tableauで作成されているので、Tableauユーザーには、特におすすめです。

BIツールとして、Tableau本を紹介します。Tableauの基本が一通り理解して使えるようになることから、おすすめします!

Tableau Desktopでのデータ加工、グラフ・ダッシュボード・ストーリー作成だけでなく、Tableau Prepによるデータ事前加工、Tableau Server・Onlineでの共有まで、データ分析実務で使えるTableau機能を、一通り学べます。

第2章のチャート作成を、手を動かしすことで、Tableauで主に使うグラフを理解でき、可視化するときに必要に応じて見返すことで、身についていくかと思います。シリーズで、より発展的な内容もあるのも、おすすめポイントです。

アクセス解析

アクセス解析(ウェブ解析)の技術だけでなく、ビジネスに活かすことが学べることから、おすすめします!

アクセス解析の「基本的な指標」、「計測設計」、「広告・エンゲージメント・オウンドメディアの解析」と、データ分析実務で使える内容を一通り学べます。加えて、「ビジネスフレームワーク」、「サイト目的に応じたKPI」と、アクセス解析とビジネスを結びつけて考えられるようになります。

一通り読んで、アクセス解析全般を理解し、直面する課題に応じて、都度読み返しながら活用するといいでしょう。5,800円と値段が高いのがネックですが、内容が充実しているので、買う価値はあるかと思います。

アクセス解析ツールとして一般的なGoogle Analytics本を紹介します。ストーリーで気軽にGoogle Analytics4(Google Analyticsの最新版)を学べることから、おすすめします!

本書は、Googleアナリィクス4の基礎知識を解説した入門書です。設定、ダッシュボード、データ探索、追加データ取得とデータ分析実務に必要なことを、一通り学べます。

ざっと読んで、Googleアナリィクスでできること、必要なことの概観をつかみましょう。

統計基礎知識

統計学を、図表やイラストが豊富で図鑑のようにパラパラとめぐるだけで気軽に学べることから、おすすめします!

本書は、「基本的な入門書は読んだが、実際に使おうとなると、どの手法を選べば良いのかわからない」という方を想定し、基礎的な部分から応用編まで、まんべんなく解説されています。記述統計学・推測統計学・仮設検定・実験計画法・回帰分析・多変量解析・ベイズ統計学です。

第1章の「統計学でできること」で、具体例に対する理論があるので、興味ある・使えそうな具体例に関する理論から学ぶと意欲的に学べるかと思います。Rコマンドが記載されていることも、おすすめポイントです。

番外編

データ分析一般

データという手段よりも、課題が何なのか、データを使う目的が大事だと考えられるようなるので、おすすめします!

  • 「問題を解く」より「問題を見極める」
  • 「解の質を上げる」より「イシューの質を上げる」

という、本書で紹介されている考え方は、データ分析実務で重要です。データ分析しても意思決定が変わらないようなビジネスインパクトがない問題に時間をかけたり、基礎集計して見ればわかるような問題に対して難しいデータサイエンス手法で解の質を上げるのに時間をかけたりすることは回避しましょう。

データドリブンの前にイシュードリブン。第1章のイシュードリブンを重点的に読み、イシュードリブンな考え方を身につけましょう。

KPIマネジメントの目的を達成するための、KPI設定方法が参考になるので、おすすめします!

データ分析職の仕事として、KPIを設定し、ダッシュボードを作成し、モニタリングできるようにするのは、チームが共通認識をもって事業推進するのに重要です。本書で、KPIの基礎から実践まで学べます。

第1章 KPIの基礎知識で、ダメなケース・KPI設定プロセスでどこに課題があるのかを把握し、実際に策定するときに、第4章 さまざまなケースから学ぶKPI事例集が参考になるでしょう。

データ分析に使う数理モデルを網羅的に知ることができることから、おすすめします!

本書は、数理モデルの全体像を理解することが重視されており、数学の専門知識がなくても、図解が豊富で、読みやすいです。統計、機械学習以外にも、最適化、時系列モデルなど、データ分析実務で使える数理モデルがあることが理解でき、データ分析要件定義の幅が拡がります。

ざっと読んで、数理モデルにどんなものがあるのか、数理モデルの構成要素を理解しましょう。

統計モデリング

数理モデルの中でも、データ分析実務でよく使う統計モデルについて、理解が深まることから、おすすめします!

本書は、「数理モデルで現象を表現・説明する」基礎訓練を受けていない人たちが読者想定になっています。統計モデルの中でも、一般化線形モデルの基礎と発展、ベイズ統計モデルについて、体系的に学ぶことができます。

まえがきの説明の流れがあるように、第2章でポアソン分布、第3章でポアソン回帰、第6章で一般化線形モデルを、重点的に学びましょう。Rコードで実行できるのも、おすすめポイントです。

機械学習

機械学習を、道具としてビジネスでどう活かすか理解できることから、おすすめします!

本書は、「機械学習プロジェクトを進めていくために必要な知識」と「Pythonで手を動かすケーススタディ」で構成されています。ケーススタディでは、マーケティング施策、オンライン広告などが扱われています。

第1部で、機械学習プロジェクトとは、機械学習で何ができるのか、システムへの機械学習導入を学び、第2部のケーススタディで興味ある例を学ぶとよいかと思います。

データ分析基盤

大量のデータ分析を可能にしている、データ分析基盤について理解できることから、おすすめします!

大量のデータ抽出をすると、Spark、Hive、PrestoなどのSQLの種類が出てきます。このような用語や、裏の仕組みを理解することができ、いかに早くデータ抽出できるのか検討できるようになります。中間テーブルを作成したり、SQLコードを工夫したり。

第1章2節のビッグデータ時代のデータ分析基盤で、データ分析基盤に必要な要素を理解し、第3章のビッグデータの分散処理で、Spark、Hive、Prestoなどのデータ抽出処理フローを理解しましょう。