Telepresence - EKSのワークロードをローカル環境でデバッグする
クラウド環境で動作しているアプリケーションのデバッグはどうしていますか? ローカル環境であれば、ローカルプロセスで起動したアプリに対してお気に入りのIDEで簡単にデバッグできますが、クラウド環境の場合はそうはいきません。 デバッグ用のコードを埋め込んでデプロイして、原因が分かったらコードを修正して、再びデプロイして。。...
記事を読むベイジアンの逆襲
皆さんは「ベイズ統計」という言葉を聞いたことがあるでしょうか? 私が統計学を勉強した時は、統計と言えば「記述統計」か「推計統計」のことでした。 なので最初にベイズ統計という言葉を聞いた時も「ベイズ?何それ美味しいの?」っていう感じでした。 近年はベイズ統計やベイズの定理、ベイズ確率などの言葉を頻繁に聞くようになりました。 ベイズの理論を使って実用化されている物には「迷惑メールの振り分け機能」などがあり、様々な分野で利用されているようです...
記事を読むセキュリティソフト ESET を利用している環境で Rancher Desktop (lima) を使う
庄司です。 皆さんは mac でセキュリティ対策ソフトウェアに何をお使いでしょうか。私は ESET を使用しています。 ESET のファイアウォール機能を有効にして Docker Desktop の代替として Rancher Desktop や lima を使用していると、イメージを pull するときにエラーが発生し困ったことがあり、その回避方法について調べてみました。 --> Warningこの記事では、ファイアウォールにアプリケーションを許可する方法で回避する手順を示しています...
記事を読む仮説検定はなぜ遠回りするのか
今回は統計解析の原点に立ち戻って「仮説検定」について私が理解した範囲でご説明したいと思います。 仮説検定とは # 統計解析の勉強を始めて一番最初に引っかかる概念に「仮説検定」があります。 私は最初に仮説検定の話を聞いたときに「なんて回りくどい解法なんだろう」と思いました。 仮説検定とは、簡単にいうと「ある仮説を立てて、その仮説が正しいか正しくないかを統計学を用いて検証する」手法です。 仮説検定には「帰無仮説」「対立仮説」というものが出てきます...
記事を読むJUnit5のExtension実装 - テストライフサイクルコールバックと引数の解決
JUnit5がリリースされてから5年近く経ちましたが、皆さんはもう乗り換えましたか?私も遅ればせながら1年くらい前から本格的に使い始めましたがJUnit5便利ですよね。@Nestedのテストのカテゴリ化や@ParameterizedTestによるパラメタライズドテストなどJUnit5から入った便利な機能はいくつもありますが、その中でも筆者が特に気に入っているのはExtensionによるテストライフサイクルコールバックの拡張と引数の解決です...
記事を読む線形回帰を疑ってかかるこれだけの理由
今回は「線形回帰」について解説します。 皆さんは「回帰分析」という言葉を一度くらいは聞いたことがあるのではないでしょうか。 線形回帰は統計学で言うところの回帰分析の一つです。 説明変数(入力)を使って従属変数(予測値)を予測します。 線形回帰のうち、説明変数が1つの場合を単回帰、2つ以上の場合を重回帰と呼びます。 今回は線形回帰を使って、説明変数(入力)から従属変数(予測値)を計算する予測式を作ってみましょう...
記事を読む相関係数だけで一喜一憂してはいけない理由
今回は「相関行列」について解説します。 これまでデータの関係性を「平均値の差」や「分散の差」で確認してきました。 今回はデータの関係性を別な方法で確認してみましょう。 お題:「データ間の関係の強弱を見極めたい」 # あなたが品質管理者だと仮定します。 ソフトウェア開発現場から数プロジェクトの仕様書レビューの結果が持ち込まれました。 持ち込まれたデータからデータ間の関係性を見出し、次の施策につなげたいと考えています...
記事を読むOpenLibertyとVSCodeによるコンテナを用いた開発環境の構築
昨今の開発ではコードの修正が即反映されデバックも行えるHot Reloadの仕組みが当たり前になっていますが、これをコンテナを使ったJava開発で行おうとした場合、変更をどのように即座にコンテナ側に反映させるかが少し悩ましかったりします...
記事を読むStrimzi - Kubernetes で Kafka を運用するための Operators
Apache Kafka は高速でスケーラブルな pub/sub 型の分散メッセージングシステムです。Kafka クラスターに配置された Topic に Consumer アプリが Subscribe し、Producer が送信するメッセージを順次処理していきます。 Kafka はコンテナや Kubernetes 以前からの歴史があり、近年 Kubernetes で運用する事例も増えてきています...
記事を読む2要因の分散分析
前回のブログ記事では「1要因分散分析」を見てきました。 今回は2つの要因の分散分析について見ていきましょう。 要因が増えると何がおこる? # コロナ禍になって出社勤務から在宅勤務に切り替えた会社さんも多いのではないでしょうか。 これまでは出社して皆で直接顔を突き合わせて実施してきた共同作業からリモート環境での共同作業に変わったときに、従来の作業パフォーマンスが出せているのか非常に気になるところだと思います。 出社形態を1要因と考えて、「出社」と「在宅」という条件の2水準を持つとしてみましょう...
記事を読むADFSとCognito Userpoolsの連携
庄司です。 ブラウザなどの UI からアクセスするマイクロサービスでは JWT 認証 (OpenID Connect 等) を利用することが一般的です。AWS を利用している場合には、Amazon Cognito user pools (Cognito Userpools) で JWT の発行が可能です。 Cognito Userpools を利用する場合には、システムにアクセスするユーザーをこのサービスに登録する必要があります...
記事を読む水準が3つ以上のデータを分析したい
これまで「対応あり・なしの2つのデータ群について差」の検定を実施してきました。 では、3つ以上のデータ群の差を検定するにはどうすればいいでしょうか? 実はt検定は2群の差までしか検定することが出来ません。 3つ以上の条件での分析には「分散分析」を用いることになります。 今回も統計解析ツールjamoviを使ってデータ分析を行っていきます。 要因・水準について # 今後必要になるので統計用語について説明しておきます。 統計では「改善前、改善後」などの条件を「水準」と呼びます...
記事を読む対応のあるデータの差を検定する
前回のブログ記事では「対応なしt検定」について見ていきました。 今回は「対応ありt検定」で例題を解いていきましょう。 今回も統計解析ツールjamoviを使ってデータ分析を行っていきます。 お題「2種類の試行の差の確認」 # 今回のお題は以下を考えます。 ある組織では静的解析ツールを用いてプログラムのソースコードから欠陥候補を抽出している。 これまで設定Aでツールを運用してきたが、新しく設定Bを作成した。 設定Aと設定Bの2種類の設定で、静的解析ツールの欠陥抽出数に差があるかどうかを確認したい...
記事を読む11tyで生成したマークダウン記事の画像を拡大する
早いものでデベロッパーサイトを開設して半年ほど経過しました。継続的に記事も公開し、もうすぐ100本に到達します。 今後は記事の執筆と並行して、サイト自体のUI/UX改善にも取り組んでいきたいと思います。 今回は改善要望として上がっていた記事の画像のズーム機能について対応しました。デベロッパーサイトなのでここではそのやり方も記事として紹介したいと思います。 現在このデベロッパーサイトでは、SSGツールのeleventyで、マークダウン記事をHTMLへと変換しています...
記事を読む品質改善効果を検定で確認する
データ分析・解析系の記事をすばやく検索するために Analytics タグを用意しました。 このタグを使って本シリーズ記事を検索していただけたら幸いです。 今回も統計解析ツールjamoviを使ってデータ分析を行っていきます。 お題「品質改善前後の効果の確認」 # 今回は品質改善施策を実施する前と実施した後の効果を検定を使って確認していきたいと思います。 お題として以下を考えます。 ある組織で品質改善活動を実施した...
記事を読むArchUnitで考えるアーキテクチャ構造とその検証
「進化的アーキテクチャ」に続き「ソフトウェアアーキテクチャの基礎(日本語版)」発売で再び注目を浴びてきたArchUnitですがTips的な情報があまりネットにないので、これはArchUnitで検証しておこう!というパターンをよくありそうなアプリケーションを題材に実装例をまとめてみました。また、実装例だけだと味気ないので筆者なりのアーキテクチャに対する考え方を合わせて少しご紹介します。 --> Informationこの記事はArchUnit 0.23.1をもとに作成しています...
記事を読む箱ひげ図で外れ値を確認する
前回のブログ記事では統計解析ツールjamoviを使って1標本t検定を行う例をご紹介しました。 今回は再度jamoviを使いつつ、データ分析をする上でネックになる”外れ値”を箱ひげ図を使って確認し、分析に適用していく方法をご紹介します。 外れ値とは # データ分析を実施していると、値自体は「異常」ではないが「他の値から大きく外れた値」が分析をする上で問題になることがあります。この「他の値から大きく外れた値」のことを統計では「外れ値」と呼んでいます...
記事を読むGitHub Codespaces を使いはじめる
GitHub Codespaces は GitHub が提供するクラウド開発環境です。GitHub 社内で運用されていた Codespaces が間もなく一般にもリリースされそうです。 Codespaces --> InformationGitHub 社内の開発環境は昨年 Codespaces に移行し、社員の環境構築作業が劇的に改善されました。マシンスペックの変更も設定ファイルを1行書き換えるだけで完了するとのことです。社員からの評価も非常に高いようです...
記事を読むサービスメッシュが解決しようとしている課題
庄司です。 この記事では、サービスメッシュがどのような課題を解決しようとしているかについて概説します。 アプリケーションは、時間の経過とともに大きく複雑になっていきます。モノリスで始めたアプリケーションもやがて単一のチームでは手に負えなくなります。 やがて分割する時期を迎えます。アプリケーションを分割したそれぞれの部分 (パート) を SOA 時代以降では「サービス」と呼びます...
記事を読むWindows、macOS で sshfs を使用する
庄司です。 この記事では、Windows、macOS で sshfs を使用する手順を説明しますが、この説明の前に、sshfs について調べるきっかけになった背景を記述させてください。 私は Docker Desktop の代替として Rancher Desktop を使っています。macOS 上では Rancher Desktop の仮想 Linux 環境に lima が利用されています。 Windows や macOS の場合、仮想 Linux 環境上でコンテナが動作します...
記事を読む