
線形回帰を疑ってかかるこれだけの理由
今回は「線形回帰」について解説します。 皆さんは「回帰分析」という言葉を一度くらいは聞いたことがあるのではないでしょうか。 線形回帰は統計学で言うところの回帰分析の一つです。 説明変数(入力)を使って従属変数(予測値)を予測します。 線形回帰のうち、説明変数が1つの場合を単回帰、2つ以上の場合を重回帰と呼びます。 今回は線形回帰を使って、説明変数(入力)から従属変数(予測値)を計算する予測式を作ってみましょう...
記事を読む相関係数だけで一喜一憂してはいけない理由
今回は「相関行列」について解説します。 これまでデータの関係性を「平均値の差」や「分散の差」で確認してきました。 今回はデータの関係性を別な方法で確認してみましょう。 お題:「データ間の関係の強弱を見極めたい」 # あなたが品質管理者だと仮定します。 ソフトウェア開発現場から数プロジェクトの仕様書レビューの結果が持ち込まれました。 持ち込まれたデータからデータ間の関係性を見出し、次の施策につなげたいと考えています...
記事を読む2要因の分散分析
前回のブログ記事では「1要因分散分析」を見てきました。 今回は2つの要因の分散分析について見ていきましょう。 要因が増えると何がおこる? # コロナ禍になって出社勤務から在宅勤務に切り替えた会社さんも多いのではないでしょうか。 これまでは出社して皆で直接顔を突き合わせて実施してきた共同作業からリモート環境での共同作業に変わったときに、従来の作業パフォーマンスが出せているのか非常に気になるところだと思います。 出社形態を1要因と考えて、「出社」と「在宅」という条件の2水準を持つとしてみましょう...
記事を読む水準が3つ以上のデータを分析したい
これまで「対応あり・なしの2つのデータ群について差」の検定を実施してきました。 では、3つ以上のデータ群の差を検定するにはどうすればいいでしょうか? 実はt検定は2群の差までしか検定することが出来ません。 3つ以上の条件での分析には「分散分析」を用いることになります。 今回も統計解析ツールjamoviを使ってデータ分析を行っていきます。 要因・水準について # 今後必要になるので統計用語について説明しておきます。 統計では「改善前、改善後」などの条件を「水準」と呼びます...
記事を読む対応のあるデータの差を検定する
前回のブログ記事では「対応なしt検定」について見ていきました。 今回は「対応ありt検定」で例題を解いていきましょう。 今回も統計解析ツールjamoviを使ってデータ分析を行っていきます。 お題「2種類の試行の差の確認」 # 今回のお題は以下を考えます。 ある組織では静的解析ツールを用いてプログラムのソースコードから欠陥候補を抽出している。 これまで設定Aでツールを運用してきたが、新しく設定Bを作成した。 設定Aと設定Bの2種類の設定で、静的解析ツールの欠陥抽出数に差があるかどうかを確認したい...
記事を読む品質改善効果を検定で確認する
データ分析・解析系の記事をすばやく検索するために Analytics タグを用意しました。 このタグを使って本シリーズ記事を検索していただけたら幸いです。 今回も統計解析ツールjamoviを使ってデータ分析を行っていきます。 お題「品質改善前後の効果の確認」 # 今回は品質改善施策を実施する前と実施した後の効果を検定を使って確認していきたいと思います。 お題として以下を考えます。 ある組織で品質改善活動を実施した...
記事を読む箱ひげ図で外れ値を確認する
前回のブログ記事では統計解析ツールjamoviを使って1標本t検定を行う例をご紹介しました。 今回は再度jamoviを使いつつ、データ分析をする上でネックになる”外れ値”を箱ひげ図を使って確認し、分析に適用していく方法をご紹介します。 外れ値とは # データ分析を実施していると、値自体は「異常」ではないが「他の値から大きく外れた値」が分析をする上で問題になることがあります。この「他の値から大きく外れた値」のことを統計では「外れ値」と呼んでいます...
記事を読む統計解析ツールjamoviの紹介
皆様、どんなツールを使ってデータ分析されていますか? 日頃から同僚・後輩・上司に「こんなデータがあるんだけど、これって意味があるデータなのかな?」なんていう相談されて困ってはいないでしょうか? そんな時こそ簡単便利な統計解析ツールの出番です。 もちろんExcelが手元にあればExcelの「分析ツール」を有効化して分析作業は実施できます。 でもExcelは有料だし、ちょっと手の込んだ分析を実施したいと思った場合は統計用プログラミング言語「R」で分析を行うことになるでしょう...
記事を読む