統計の話をしようじゃないか - ソフトウェア品質のための統計入門(No.15 統計的品質管理(SQC)の実践事例紹介)
はじめに:いよいよ品質分析の集大成へ # 「不具合がなぜ減らないのか?」「このプロセスは本当に安定しているのか?」 ――そんな問いに、あなたは統計で答えられますか? ここまで、ソフトウェア品質をテーマに、統計的な視点から多くの分析手法を学んできました。 そしていよいよ「統計の話をしようじゃないか」第15回、本シリーズの集大成として登場するのが、統計的品質管理(SQC: Statistical Quality Control) です...
記事を読む文字コード これだけは覚えておこう ~UTF-8編~
はじめに # 今回は新人さんに向けての記事ということで、我々日本語を扱うプログラマーが長年捕らわれ続けている問題である「文字コード」の問題について語りたいと思います。 現場で起きやすい不具合の多くが文字コードに起因しており、避けて通れない知識です。 「文字コード」には非常に長い歴史があり、当時の技術者たちが直面した制約の中で生まれた、苦悩や試行錯誤の積み重ねの産物です。そのため、現在の姿だけを見て「いまいち」「分かりにくい」と単純に批評できません...
記事を読む統計の話をしようじゃないか - ソフトウェア品質のための統計入門(No.14 予測:回帰分析で品質を読み解く)
はじめに # 「統計の話をしようじゃないか」第14回では、回帰分析という手法を用いて「将来を予測する」ことに挑戦します。 この連載では、過去データから全体像や関係性を把握してきましたが、今回はその知見を活かして、「将来どうなるか」を具体的な数値で予測する方法を学びます...
記事を読む「事実はひとつ、真実は人の数だけ?」─ 新人プロジェクトマネージャーがコナンに学ぶ“探偵型マネジメント”思考法
はじめに # 新人プロジェクトマネージャー(PM)の皆さん。 メンバーとの「認識のズレ」やコミュニケーションの難しさに悩むことがありますよね。 その原因は、客観的な 「事実」 と、主観的な 「真実」 を混同しているからかもしれません。 この記事では「探偵型マネジメント」という思考法を紹介します。 コナンの言葉をヒントに「事実」と「真実」を見極め、プロジェクトを円滑に進めます。 「真実はいつもひとつ!」 ― 名探偵コナン しかし、プロジェクトの現場に立つと、次のように思うことがあります...
記事を読む統計の話をしようじゃないか - ソフトウェア品質のための統計入門(No.13 相関と因果:散布図と相関係数の落とし穴)
はじめに # これまでの連載では、平均や割合といった代表値を通じて、「母集団の傾向を推定する」手法について解説してきました。 具体的には、標本平均から母平均を推定したり、割合の差を比較したりといった場面で、統計的推定や仮説検定を用いる方法を取り上げてきました。 しかし実務では、「ある要因が別の結果に影響を与えているのか?」という、よりダイナミックな関係性に注目したい場面も少なくありません...
記事を読む統計の話をしようじゃないか - ソフトウェア品質のための統計入門(No.12 仮説検定:有意差って本当に意味あるの?)
はじめに # これまでは、「母集団の傾向を推定する」ために、主に以下のような手法を見てきました。 標本から母平均や母割合を推定する 推定値のばらつきを示す「標準誤差(SE)」 統計的な不確かさを数値で表す「信頼区間(Confidence Interval)」 これらはすべて、母集団の特徴を「どれくらいの精度で言えるか?」という推定の話です。 これに対して、統計的に“YESかNOか”を判断するための道具が、今回扱う仮説検定です...
記事を読む統計の話をしようじゃないか - ソフトウェア品質のための統計入門(No.11 信頼区間と誤差:この結果、どこまで信じていい?)
はじめに # 「統計の話をしようじゃないか」第11回では、「信頼区間」や「標準誤差」といった推測統計の基本概念を、報告書や品質判断にどう応用できるかという実務視点で解説します。 ソフトウェア品質の現場でも、「結果をどれだけ信じてよいか?」という問いに対して、 信頼区間やZスコアによる不確かさの定量化がますます重要になっています。 確率論と統計的推測の違い:基礎を押さえておこう # 第8回目でも触れましたが、おさらいとしてもう一度書きます...
記事を読む統計の話をしようじゃないか - ソフトウェア品質のための統計入門(No.10 母集団と標本:中心極限定理、大数の法則)
はじめに # 「すべてを調べられたら完璧だが、現実にはそれは無理」 ――これは品質管理だけでなく、あらゆる調査や分析に共通する課題です。 「統計の話をしようじゃないか」第10回では、「母集団」と「標本」という推測統計の基本概念を紹介し、 推測統計の根幹を支える「中心極限定理」「大数の法則」について説明します。 また、そこから生まれる 「サンプリング誤差」や「バイアスの危険性」 について、実務的な視点から解説します...
記事を読む統計の話をしようじゃないか - ソフトウェア品質のための統計入門(No.9 正規分布とその周辺:3σルールの意味と限界)
はじめに # 品質管理における統計の代表的なキーワードに「±3σ(スリーシグマ)」があります。 これは 「正規分布」を前提 として、データのばらつきをどこまで許容するかを示すルールであり、異常検知や工程管理の現場で頻繁に登場します。 しかし「正規分布であれば...」という前提がそもそも怪しい場合も少なくありません。 「統計の話をしようじゃないか」第9回では、3σルールの意味とその限界、正規分布に近似できない現場データへの対応について解説していきます...
記事を読む「問題」と「課題」の違いから始めよう ― 新人プロジェクトマネージャー向け:はじめての課題管理ガイド
はじめに # 「なんとなくプロジェクトがうまく回っていないように思える…」 「トラブル発生、でも何から手をつければいいかわからない…」 「会議で“問題点は何でしょうか”って聞かれたけど、うまく言葉にできない…」 新人プロジェクトマネージャー(PM)の皆さん、こんな悩みを抱えていないでしょうか。 プロジェクトに問題はつきものです。 そんなとき、ベテランPMがよく言う「問題を課題に落とし込もう」という言葉。 しかし、「問題」と「課題」は何が違うのでしょうか...
記事を読む統計の話をしようじゃないか - ソフトウェア品質のための統計入門(No.8 確率の直感と計算:「偶然」の正体を知る)
はじめに # 「統計の話をしようじゃないか」第8回では、「確率」の直感的な捉え方と基本的な計算方法、そして品質管理の現場で役立つ確率分布について解説します。 「なぜそんなバグが?」 「たまたまテストで見つからなかっただけでは?」 ――そんな“偶然”の現象を、科学的に扱うためのツールが「確率」です...
記事を読む統計の話をしようじゃないか - ソフトウェア品質のための統計入門(No.7 PythonとExcelで描く統計グラフ入門)
はじめに # 「統計の話をしようじゃないか」第7回では、実務で使えるグラフの描き方を紹介します。 これまで紹介してきた「代表値」「ばらつき」「分布の形」などは、視覚的に示してこそ価値があるものです。 今回は、現場でもよく使われるPython(matplotlib/pandas)とExcelの2通りで、次のような統計グラフを実際に描いてみましょう...
記事を読む統計の話をしようじゃないか - ソフトウェア品質のための統計入門(No.6 実務に効くグラフの正しい使い分け)
はじめに # 「統計の話をしようじゃないか」第6回では、実務におけるグラフの使い分けをテーマに扱います。 データを相手に“伝える”場面では、グラフの使い方が極めて重要です。 どんなに分析が正しくても、グラフの選び方や描き方を誤ると、誤解や不信感を招くことにもなりかねません。 今回は、実務で頻出する以下の6つの基本グラフについて、使い分けのポイントを整理します...
記事を読む統計の話をしようじゃないか - ソフトウェア品質のための統計入門(No.5 形状を知る:歪度・尖度と分布のクセ)
はじめに # 「統計の話をしようじゃないか」第5回では、データの「形」に着目します。 これまでに代表値やばらつきを見てきましたが、分布の形状そのものに注目することで、データの本質がより明確になります。 今回は以下の2つの指標を中心に紹介します: 歪度(Skewness)… 分布の“非対称性” 尖度(Kurtosis)… 分布の“とがり具合”や“尾の重さ” 品質管理においても、「正規分布であること」を前提に統計的な管理や判断が行われる場面が多いため、非正規分布を見抜く力が求められます...
記事を読むOpenAI APIに新しく追加されたツールを使う 〜 リモートMCP・画像生成・コードインタープリター 〜
つい先月ですが、OpenAIのAPIに新しい組み込みツールの追加が発表されました...
記事を読むGemini Code Assistで15パズルを作ろう
はじめに # アジャイルグループの石田です。今回はアジャイルやスクラムといったテーマから少し離れて、生成AIについてお話しします。 Googleが提供するGemini Code Assistは、生成AIを用いたコーディング支援ツールの1つです。2025年2月以降、個人向けの無料版が提供されており、コード補完は1日6,000件、チャットリクエストは1日240件まで利用できます。個人開発で使うには十分すぎるほどの利用制限で、非常に魅力的です...
記事を読むCCPMツール編:現場で動く!スプレッドシート×Apps Scriptで“本物のCCPM”を回す方法
はじめに # 前回の記事「CCPM実践編」では、CCPMによる現場変革の効果を紹介しました。 今回はその裏側、どうやって現実的なCCPMスケジュールを作のかについてツールを交えて紹介します。 1. 背景:なぜ専用ツールではなく、スプレッドシート+GASなのか? # CCPM対応の商用ツールは、たしかに強力ですが、現場に導入しようとすると以下のような壁にぶつかります...
記事を読む統計の話をしようじゃないか - ソフトウェア品質のための統計入門(No.4 ばらつきの把握:分散・標準偏差・レンジ)
はじめに # 「統計の話をしようじゃないか」第4回は、ばらつきの把握をテーマにお話しします。 品質データに限らず、あらゆる実測データは多かれ少なかれ、ばらつきを含んでいます。 平均値や中央値といった代表値だけでは、分布の広がり(散らばり)が見えず、誤った解釈につながることもあります...
記事を読むUMLspecification ver.2.5.1に基づくUseCaseの概念的理解
UMLユースケース図の深層理解:UseCaseを概念から読み解く # 1. はじめに:なぜ今、UMLユースケース図の概念を深掘りするのか # システム開発プロジェクトにおいて、UMLを用いたモデリングは、要件定義から設計、実装に至る各フェーズで極めて重要な役割を担います。 特に、ステークホルダー間の共通理解形成や機能要件の明確化において、UseCaseを用いるのは非常に効果的です...
記事を読む統計の話をしようじゃないか - ソフトウェア品質のための統計入門(No.3 代表値の使い分け:平均・中央値・最頻値)
はじめに # 「統計の話をしようじゃないか」第3回は、「代表値の使い分け」についてお話しします。 世の中にはデータが溢れています。 「データの中心って、どう表せばいいのか?」 統計の最も基本的な問いの一つがこれです。 品質データを扱うとき、よく「平均値」が使われますが、それだけで本当に適切な判断ができているでしょうか? 実は、「平均・中央値・最頻値」はそれぞれ違った特徴を持っており、使い方を間違えると誤解を招く恐れもあります...
記事を読む