Microsoft Presidio: 個人情報保護に特化したオープンソースツール
近年、個人情報の保護に対する意識がますます高まっていると感じます。 その背景には、大規模言語モデル(LLM)の導入と普及があります。LLMはさまざまな場面で活用されていますが、取り扱うデータの中に個人情報が含まれる可能性があるため、適切な管理が求められています。 そんな状況の中で、今回Microsoftが提供するオープンソースツール Presidio に注目しました...
記事を読む機械学習と倫理の話
これは豆蔵デベロッパーサイトアドベントカレンダー2024第25日目の記事です。 江川と申します。機械学習のソフトウェアエンジニアをしています。 --> 豆蔵デベロッパーサイト運営より江川崇氏は、機械学習を専門とするソフトウェアエンジニアです。氏は豆蔵のOBでもあることから、そのご縁でアドベントカレンダーに寄稿いただけることになりました。 氏は多くの著作・翻訳でも知られますが、本記事に関係深い直近の翻訳にオライリー・ジャパンから昨年出版された「機械学習システムデザイン」があります...
記事を読む大規模言語モデル初心者がハリーポッター対話モデルを作ってみた
はじめに # ChatGPTの普及により、文章生成技術がますます身近になっています。 ChatGPTをはじめとする生成系AIは、巨大なテキストデータセットから学習した大規模言語モデル(LLM)をベースとしています。 このLLMは、ファインチューニングによってカスタマイズ可能で、特定の領域に特化したモデルを作成できます。 私はLLM初心者でしたが、ファインチューニングを試してみたいと思っていました...
記事を読む日本語GPTで雑談対話モデルを作ろう
この記事は夏のリレー連載2023の11日目の記事です。 はじめに # 最近ChatGPTをはじめ生成系AIツールが様々、発表されています。 大量のテキストデータを使ってトレーニングされた大規模言語モデル(LLM)では、そのモデルを用いたツールはもちろんのこと、モデルそのものも日進月歩の勢いで多数開発されています...
記事を読むRust でML に挑戦してみた
この記事は夏のリレー連載2023の10日目の記事です。 1. はじめに # こんにちは。この記事が初投稿となります、松本です。よろしくお願いします。 さて、C/C++ に代わる言語として注目を浴びている Rust ですが、ML や NN の記事量は圧倒的に Python で、Rust で書いた例はググってもあまり見ない気がします。しかし速度を重視する場合、必ずしもメモリ安全ではない C/C++ を使わざるを得ず、メモリ安全で高速な Rust は魅力があります...
記事を読むChatGPT先生に教わりながら「Transformerの肝」である「注意機構(Attention機構)」を可視化する
前回と前々回では機械学習アーキテクチャ「Transformer」を使って簡単な文章生成に挑戦しました。 ちょっと前までは、プログラミングで調べたいことがあるときは「Google先生」にお伺いを立てていたのですが、最近は「ChatGPT先生」にお伺いを立てることが増えました。 (ここでは ChatGPT に対して敬意を込めて「ChatGPT先生」と呼称しています...
記事を読むChatGPTに自然言語処理モデル「GPT2-Japanese」の使用方法を聞きながら実装したら想像以上に優秀だった件
前回は ChatGPT と Hugging Face を簡単に触ってみました。 今回は ChatGPT に自然言語処理モデル「GPT2-Japanese」の使用方法を聞きながらプログラムを実装してみたところ、想像以上に優秀だったので、その過程をご紹介したいと思います...
記事を読むChatGPTのベースになった自然言語処理モデル「Transformer」を調べていたら「Hugging Face」に行き着いた
ChatGPT を使ってみる # 最近「ChatGPT」というワードがSNSを賑わしているようです。 筆者は技術に対しては非常にミーハー(?)なので、ChatGPTが何なのか?また、どれほど凄いのか試してみたくなりました。 さっそく ChatGPT を使ってみたいと思います。 (ChatGPTの利用登録の方法については、解説サイトがたくさんありますのでそちらを参照ください...
記事を読む機械学習モデル可視化ツール「Netron」を使ってみる
前回、ディープラーニングモデルのオープンフォーマット「ONNX(Open Neural Network Exchange)」を紹介しました。 その時に機械学習モデル可視化ツール「Netron」の存在を知りました。 今回は「Netron」を紹介したいと思います。 Netron って何? # Netronは、機械学習モデルを可視化するツールです。 ブラウザを含むクロスプラットフォームで動作します...
記事を読むディープラーニングモデルのオープンフォーマット「ONNX(Open Neural Network Exchange)」を使ってみる
ディープラーニング・アプリケーション開発キット”OpenVINO”を調べていた時、「ONNX」という単語に出会いました。 筆者の知らない単語だったので調べてみると、ONNX は「ディープラーニングモデルのオープンフォーマット」であることがわかりました。 今回はディープラーニングモデルのオープンフォーマット「ONNX」を紹介したいと思います...
記事を読む