
転ばぬ先のベイズの定理
前回のブログ記事でベイズ統計について簡単にご紹介しました。 今回はベイズ統計の基本中の基本である「ベイズの定理」について私の理解した範囲でご説明したいと思います。 ベイズの定理とは # ベイズの定理は以下の式で表されます。 ここでAとBは事象であり、式として成立するためにP(B)は0ではないです。 P(A|B)は「Bを前提としてAが発生する確率(事後確率)」を示します。(条件付き確率) P(B|A)は上記の逆で「Aを前提としてBが発生する確率」を示します...
記事を読むベイジアンの逆襲
皆さんは「ベイズ統計」という言葉を聞いたことがあるでしょうか? 私が統計学を勉強した時は、統計と言えば「記述統計」か「推計統計」のことでした。 なので最初にベイズ統計という言葉を聞いた時も「ベイズ?何それ美味しいの?」っていう感じでした。 近年はベイズ統計やベイズの定理、ベイズ確率などの言葉を頻繁に聞くようになりました。 ベイズの理論を使って実用化されている物には「迷惑メールの振り分け機能」などがあり、様々な分野で利用されているようです...
記事を読む仮説検定はなぜ遠回りするのか
今回は統計解析の原点に立ち戻って「仮説検定」について私が理解した範囲でご説明したいと思います。 仮説検定とは # 統計解析の勉強を始めて一番最初に引っかかる概念に「仮説検定」があります。 私は最初に仮説検定の話を聞いたときに「なんて回りくどい解法なんだろう」と思いました。 仮説検定とは、簡単にいうと「ある仮説を立てて、その仮説が正しいか正しくないかを統計学を用いて検証する」手法です。 仮説検定には「帰無仮説」「対立仮説」というものが出てきます...
記事を読む線形回帰を疑ってかかるこれだけの理由
今回は「線形回帰」について解説します。 皆さんは「回帰分析」という言葉を一度くらいは聞いたことがあるのではないでしょうか。 線形回帰は統計学で言うところの回帰分析の一つです。 説明変数(入力)を使って従属変数(予測値)を予測します。 線形回帰のうち、説明変数が1つの場合を単回帰、2つ以上の場合を重回帰と呼びます。 今回は線形回帰を使って、説明変数(入力)から従属変数(予測値)を計算する予測式を作ってみましょう...
記事を読む相関係数だけで一喜一憂してはいけない理由
今回は「相関行列」について解説します。 これまでデータの関係性を「平均値の差」や「分散の差」で確認してきました。 今回はデータの関係性を別な方法で確認してみましょう。 お題:「データ間の関係の強弱を見極めたい」 # あなたが品質管理者だと仮定します。 ソフトウェア開発現場から数プロジェクトの仕様書レビューの結果が持ち込まれました。 持ち込まれたデータからデータ間の関係性を見出し、次の施策につなげたいと考えています...
記事を読む2要因の分散分析
前回のブログ記事では「1要因分散分析」を見てきました。 今回は2つの要因の分散分析について見ていきましょう。 要因が増えると何がおこる? # コロナ禍になって出社勤務から在宅勤務に切り替えた会社さんも多いのではないでしょうか。 これまでは出社して皆で直接顔を突き合わせて実施してきた共同作業からリモート環境での共同作業に変わったときに、従来の作業パフォーマンスが出せているのか非常に気になるところだと思います。 出社形態を1要因と考えて、「出社」と「在宅」という条件の2水準を持つとしてみましょう...
記事を読む水準が3つ以上のデータを分析したい
これまで「対応あり・なしの2つのデータ群について差」の検定を実施してきました。 では、3つ以上のデータ群の差を検定するにはどうすればいいでしょうか? 実はt検定は2群の差までしか検定することが出来ません。 3つ以上の条件での分析には「分散分析」を用いることになります。 今回も統計解析ツールjamoviを使ってデータ分析を行っていきます。 要因・水準について # 今後必要になるので統計用語について説明しておきます。 統計では「改善前、改善後」などの条件を「水準」と呼びます...
記事を読む対応のあるデータの差を検定する
前回のブログ記事では「対応なしt検定」について見ていきました。 今回は「対応ありt検定」で例題を解いていきましょう。 今回も統計解析ツールjamoviを使ってデータ分析を行っていきます。 お題「2種類の試行の差の確認」 # 今回のお題は以下を考えます。 ある組織では静的解析ツールを用いてプログラムのソースコードから欠陥候補を抽出している。 これまで設定Aでツールを運用してきたが、新しく設定Bを作成した。 設定Aと設定Bの2種類の設定で、静的解析ツールの欠陥抽出数に差があるかどうかを確認したい...
記事を読む品質改善効果を検定で確認する
データ分析・解析系の記事をすばやく検索するために Analytics タグを用意しました。 このタグを使って本シリーズ記事を検索していただけたら幸いです。 今回も統計解析ツールjamoviを使ってデータ分析を行っていきます。 お題「品質改善前後の効果の確認」 # 今回は品質改善施策を実施する前と実施した後の効果を検定を使って確認していきたいと思います。 お題として以下を考えます。 ある組織で品質改善活動を実施した...
記事を読む箱ひげ図で外れ値を確認する
前回のブログ記事では統計解析ツールjamoviを使って1標本t検定を行う例をご紹介しました。 今回は再度jamoviを使いつつ、データ分析をする上でネックになる”外れ値”を箱ひげ図を使って確認し、分析に適用していく方法をご紹介します。 外れ値とは # データ分析を実施していると、値自体は「異常」ではないが「他の値から大きく外れた値」が分析をする上で問題になることがあります。この「他の値から大きく外れた値」のことを統計では「外れ値」と呼んでいます...
記事を読む