機械学習(Machine Learning)はアカデミック分野にとどまらず、産業界全体を巻き込んで我々の生活を大きく変革しています。システム開発においても、機械学習モデルの活用を前提とするケースが増えています。さらに生成AIはソフトウェア開発そのものも変革しています。
機械学習アルゴリズム、生成AI、MLOps など機械学習にまつわる幅広い内容の記事を集めていきます。
生成AI
#LLM
#- 独自のデータに基づくAzure OpenAI機能を使ってみた
- 大規模言語モデル初心者がハリーポッター対話モデルを作ってみた
- RAGを利用して国会会議録に基づいて質問に回答するLLMを作る方法
- 日本語GPTで雑談対話モデルを作ろう
- 自然言語処理初心者が「GPT2-japanese」で遊んでみた
- ChatGPTのベースになった自然言語処理モデル「Transformer」を調べていたら「Hugging Face」に行き着いた
- ChatGPTに自然言語処理モデル「GPT2-Japanese」の使用方法を聞きながら実装したら想像以上に優秀だった件
- ChatGPT先生に教わりながら「Transformerの肝」である「注意機構(Attention機構)」を可視化する
- 日本語GPTで雑談対話モデルを作ろう
- 「アテンションが全て」ではなかった?GPT2 small(124M)から学ぶLLMの仕組み
LLM をローカル環境で動かす
#LLM をローカル環境で動かすにはマシンパワーが必要ですが、課金を気にせず使えて機密情報の扱いも容易などのメリットがあります。
- ローカルLLMを使ったボイドシミュレーション(llama.cpp、llama-cpp-python)
- CUDA、cuDNN、CMake地獄を乗り越えて、激古GPU+llama.cppで量子化DeepSeekモデルを動かすまでの戦い
- Ollamaを使ってオープンソースLLMをローカルホストしてみよう
- AWSで自分だけのLLM環境を!EC2 GPUインスタンスとOllamaでAIを動かす実践ガイド
- クラウドに頼らないAI体験:LM Studioで始めるローカルLLM入門(Gemma 3)
生成AIをソフトウェア開発に適用する
#IDE 上のコード補完から始まった生成AI活用ですが、Agentic Coding / Vibe Coding が流行し、要件定義や設計の領域に関しても適用が始まっています。
KiroでAI開発革命!? アルバムアプリをゼロから作ってみた
- 【その1:要件定義・設計・実装計画】
- 【その2:プロジェクト構造の作成】
- 【その3:バックエンドの実装-前編+Steering機能】
- 【その4:バックエンドの実装-後編】
- 【その5:フロントエンドの実装-前編】
- 【その6:フロントエンドの実装-後編+まとめ】
設計への適用
- 最新LLMで“バイブコーディング”を実践(要件定義〜機能実装①)
- Kiro×AWSアーキテクチャ、どこまでWAできる?生成AIでクラウド設計やってみた!
- Kiroで実現する仕様駆動IaC開発を試してみた
プルリクエストのレビュー
IDE 統合
- 開発者体験(DX)を進化させるJetBrainsのAIアシスタント機能の紹介
- VS Code の Copilot Edits で効率的にリファクタリングを行う
- GitHub Copilot のエージェントモード(パブリックプレビュー)を試す
- 超簡単!OpenSearch MCPでClaude Codeの検索性を拡張する
- JetBrainsのJunieを使ってみた(導入編)
OpenAI 動向
#- OpenAIのChat APIに追加されたFunction callingを使ってみる
- 独自のデータに基づくAzure OpenAI機能を使ってみた
- OpenAIのAssistants API(ベータ版)を試す
- OpenAI Assistants APIのストリームレスポンスでUXを改善する
- 新しく導入されたOpenAIのバッチAPIを使ってみる
- OpenAI Assistants API(v2)で新しくなったFile Search(Vector Stores)を使う
- OpenAIのStructured Outputsを使ってAIの出力スキーマを定義する
- OpenAIの File Search の結果を分析してチューニングする
- 新登場の OpenAI の Realtime API でAIと音声会話する
- OpenAI の Realtime API で音声を使って任意の関数を実行する(Function calling編)
- OpenAI の Realtime API を使ってAIと音声会話するWebアプリを実装してみる
- OpenAI の Swarm でエージェントオーケストレーションの仕組みを理解する
- OpenAI Realtime API の音声会話アプリを WebRTC を使って実装する
- OpenAI Realtime APIのWebRTCでロボットを操作する
- 正式版になったOpenAIのVector Store / File Searchツールを使う
- OpenAI Agents SDKを使ったAIエージェント開発の概要と使い方を理解する
- OpenAI APIに新しく追加されたツールを使う 〜 リモートMCP・画像生成・コードインタープリター 〜
LangChain
#- LangChainのJava用ライブラリLangChain4jを使ってみる
- LangMemの長期記憶の概要と使い方を理解する
- LangMemの長期記憶をPostgreSQL(pgvector)に永続化する
応用
#- Microsoft Presidio: 個人情報保護に特化したオープンソースツール
- Whisper を使って会議の音声データを文字起こししてみる
- Javaでもローカル環境でWhisperを使って音声データ書き起こしをしたい
その他
#機械学習
#画像解析
#- ディープラーニング初心者がOpenVINOを使ってみる(その1:インストール編)
- ディープラーニング初心者がOpenVINOを使ってみる(その2:MobileNet画像分類編)
- Rust でML に挑戦してみた
- 画像AIで異常検知:事例に合わせたモデル選定と実践