Microsoft Presidio: 個人情報保護に特化したオープンソースツール
近年、個人情報の保護に対する意識がますます高まっていると感じます。 その背景には、大規模言語モデル(LLM)の導入と普及があります。LLMはさまざまな場面で活用されていますが、取り扱うデータの中に個人情報が含まれる可能性があるため、適切な管理が求められています。 そんな状況の中で、今回Microsoftが提供するオープンソースツール Presidio に注目しました...
記事を読むローカルLLMを使ったボイドシミュレーション(llama.cpp、llama-cpp-python)
これは豆蔵デベロッパーサイトアドベントカレンダー2024第19日目の記事です。 はじめに # こんにちは。前回、前々回に引き続き、PyGameを使って遊び……もといシミュレーションをしている大久保です。 今回は、昨今発展が著しい生成AIの分野を組み合わせてボイドモデルのシミュレーションしてみました。 「生成AIを使うってことは、高いGPUを買ったり、どっかに課金してAPIを使うんでしょう?」 と思われるかもしれませんが、実はローカルPC(CPU)でも出来ちゃったりするんです...
記事を読む独自のデータに基づくAzure OpenAI機能を使ってみた
はじめに # 今回はAzure OpenAI Service(以下AOAIとする)のプレビュー機能である「独自のデータに基づく Azure OpenAI」という機能を試してみた内容をまとめます。 独自のデータに基づくAzure OpenAI (プレビュー) この機能では利用者の独自のデータ(txtファイル、pdf、wordファイルなど)に基づいてOpenAIが公開しているチャット対話モデル(GPT-3.5、GPT-4)に質問することができます...
記事を読む大規模言語モデル初心者がハリーポッター対話モデルを作ってみた
はじめに # ChatGPTの普及により、文章生成技術がますます身近になっています。 ChatGPTをはじめとする生成系AIは、巨大なテキストデータセットから学習した大規模言語モデル(LLM)をベースとしています。 このLLMは、ファインチューニングによってカスタマイズ可能で、特定の領域に特化したモデルを作成できます。 私はLLM初心者でしたが、ファインチューニングを試してみたいと思っていました...
記事を読むRAGを利用して国会会議録に基づいて質問に回答するLLMを作る方法
はじめに # こんにちは。デジタル戦略支援事業部の藤堂です。普段はデータ分析の業務に従事し、AI TECHチームでも活動をしています。 昨年末のChatGPTの登場以降、大規模言語モデル(LLM)の可能性が広く認識されるようになりました。これらのモデルは、インターネット上の膨大な情報を学習する能力を持っていますが、法律、医療などの専門的知識や、特定の企業や個人に関連する独自の情報には疎いのが現状です...
記事を読む日本語GPTで雑談対話モデルを作ろう
この記事は夏のリレー連載2023の11日目の記事です。 はじめに # 最近ChatGPTをはじめ生成系AIツールが様々、発表されています。 大量のテキストデータを使ってトレーニングされた大規模言語モデル(LLM)では、そのモデルを用いたツールはもちろんのこと、モデルそのものも日進月歩の勢いで多数開発されています...
記事を読む