データ分析入門
―Excelで学ぶ統計―
本書は、統計を実際の経営の場面で使うことを想定した実用性の高い教科書であり、入門的なデータ分析のための統計手法を必要とする大学生や社会人に有用である。
文科省が策定したAI戦略2019により、すべての大学・高専生がリテラシーレベルの数理・データサイエンス・AIの習得を求められている。このことを背景に、本書では、経営系学部生を対象に、この分野の土台となる統計手法を確実に習得することを目指して、Microsoft Excelの操作法とそれを用いた実用性の高い問題と解答例を詳述し、読者がExcelを操作しながらデータ分析のための統計手法を一通り完全独習できるよう解説している。
統計学の結果や推定・検定の方法だけでなく、「なぜそのような結果が得られるのか」、そして「なぜそのような統計手法が用いられるのか」についても多数のグラフとイラストを用いて丁寧に解説し、読者の真の理解を促す。たとえば、連続型確率分布の学習では、[0,1]上の連続一様分布を説明する際に区間 [0,1] をn分割した離散一様分布において、分割数nを増やすとどうなるのかということを、グラフを用いながらビジュアルに訴えて説明している。
また、「なぜ、確率変数の期待値を(実現値×実現値生起確率)の合計とするのか」について、記述統計の平均との対比で説明を加えるなど、記述統計から推測統計への移行がスムーズに行えるように配慮している。
さらに、総和を表す記号Σを一切使用せず、また連続型確率分布の確率計算では「積分」ではなく「面積」という言葉を用いて、数学に対するアレルギーを排除し、高校1年生で学習する数学の知識があれば本書が読めるように配慮している。
1.1 Excelの起動
1.2 Excel の入力
1.3 ファイルの保存と読み込み
第2章 1次元のデータ
2.1 度数分布とヒストグラム
2.2 代表値
2.3 散らばりの尺度
第3章 2次元のデータ
3.1 多次元データとは
3.2 散布図
3.3 共分散と相関係数
3.4 時系列と自己相関*
3.5 回帰分析
3.6 公式3.2(回帰係数の公式)の導出*
第4章 確率
4.1 標本空間と確率
4.1.1 試行と標本空間
4.1.2 確率
4.1.3 確率変数
4.1.4 累積分布関数
4.2 確率変数と確率分布
4.2.1 離散型確率変数
4.2.2 連続型確率変数
4.3 期待値と分散
4.3.1 期待値(平均)
4.3.2 分散と標準偏差
4.3.3 期待値と分散の性質
4.4 正規分布
4.5 2変量確率変数
4.5.1 周辺分布
4.5.2 2変量確率変数の期待値
4.5.3 共分散と分散の性質
4.5.4 確率変数の独立性
4.6 大数の法則と中心極限定理
第5章 統計的推論
5.1 母集団と標本
5.2 推定量と点推定
5.3 区間推定
5.3.1 母分散の区間推定
5.3.2 母平均の区間推定
第6章 仮説検定
6.1 仮説検定の手順
6.2 正規母集団に対する仮説検定
6.2.1 母平均に関する検定
6.2.2 母分散に対する仮説検定
6.2.3 母平均の差の検定
6.2.4 対応のある平均の差の検定
6.2.5 母分散の比の検定
6.3 適合度の検定
6.4 独立性の検定
付録A
A.1 正規分布とその他の確率分布の関係
A.2 問解答例
参考文献
索引
※初学者には難しいと思われる点にアスタリスクの印(*)を付けている。
スキップしても、一通りの内容を理解できるように配慮している。
関連書籍
-
全体観をつかむ多変量解析
価格:2,750円(税込)