在内共享知识及诀窍中的生成式AI应用

Information

为了覆盖更广泛的受众，这篇文章已从日语翻译而来。
您可以在这里找到原始版本。

大家好。我是已经完全被Cosense（旧称Scrapbox）^[1]魅力所俘虏的牟田。今天是平安夜。不知不觉中，2024年也即将结束了。

这次，我将介绍我们公司内在共享知识和诀窍方面对生成式AI的应用。

用于知识与诀窍共享的Cosense应用

自从2019年7月将Cosense正式引入为公司内工具以来，已经过去5年了。Cosense现已成为全体员工日常使用的工具，并牢牢确立为公司内的门户网站。

关于在引入Cosense前的课题、如何利用Cosense解决这些问题，以及由此带来的效果，可以参考以下文章。

截至2024年12月，总页面数已超过14,000页，并且依然在不断新增信息。
然而，随着信息量的急剧增加，可搜索性^[2]及信息利用的便捷性成为了问题。

为解决这一问题，同时积累关于生成式AI（OpenAI API）的知识，我们决定以一种狗粮测试的形式尝试解决问题。

大致上，以如下图所示方式实现。

从信息输入到提取的流程如下：

以下，对具体内容进行逐一解说。

只需在Cosense中进行信息输入。正如前面所述，已有高质量且充分的信息集。

GitHub Actions定期自动获取在(1)中输入到Cosense的信息，剔除包含特定链接^[3]的页面后进行筛选。

然后，GitHub Actions将(2)中提取的信息发送至OpenAI API，并指示更新向量数据库^[4]。

信息提取通过公司内部的沟通工具Slack完成。具体来说，通过Slack应用（@mame-kun）进行提问。

Slack将请求（提问）发送至OpenAI API。

OpenAI API返回响应（回答）到Slack。

在Slack上，以对提问消息的线程回复形式显示回答。

以下是通过Slack进行提问的实际演示。

可以看出，结合Cosense中的信息和一般信息回答问题，并作为消息显示在线程中。此外，还显示了Cosense的信息来源，通过链接可以直接访问相应页面。
进一步来说，在线程中进行追加提问时，它能够理解最初的提问上下文并给出回答。
就像是在与熟悉公司内情的资深人士交流一样。

本次尝试的设计要点如下：

利用OpenAI的助手API
- 设置性格不同的两种角色
  - mame-kun：在掌握Cosense信息的基础上，以轻松方式回答问题的角色
  - mameka：对一般性问题以积极、开朗的方式回答的角色
  - 将Slack的线程与OpenAI的对话线程同步化，实现符合对话上下文的自然响应
知识库（Cosense）访问
- 利用OpenAI的File Search实现高效信息获取
  - 语义搜索与关键词搜索的混合方法
  - 定期引入并更新Cosense内的信息
- 由于是公司内部信息，禁止外部用户访问
  - 通过Slack用户信息进行判定（通过GitHub的访问会抑制）
网络搜索 / 浏览
- 为了获取最新信息和抑制幻觉，实施了Perplexity搜索和浏览功能
  - 不仅是简单的URL获取，还利用实际浏览器操作（Playwright）支持基于JavaScript的动态网站（如SPA等）
    - 关于此点改进详情，请参阅相关文章
- Perplexity搜索使用了Perplexity API
- 借助Function Calling，将实际的使用判断交由AI助手处理
多模态
- 对Slack的附件图片，通过与OpenAI API的Storage服务关联实现图片输入功能
  - 使用OpenAI的Vision
  - 音频输入目前尚未实现

通过本次尝试，公司内部生成式AI的应用得到促进，不仅加深了对AI技术的理解，同时也带来了以下效果：

意外信息的发现（惊喜）
- 借助生成式AI的问答功能，可以更高效地提取Cosense中的信息。而且，最重要的是，在信息提取的过程中，发现了意想不到的信息及其关联的乐趣。
自己录入的知识能够帮助他人
- 感受到以上效果的每位员工，更加积极地为公司内部知识与诀窍的积累（即录入Cosense）做贡献，从而产生了进一步共享知识与诀窍的动力。这种良性循环开始形成。

你觉得如何？

生成式AI虽然在提高生产力、优化工作效率等方面的应用依然是主流，但通过本次尝试，我们确认生成式AI也能为组织文化带来些许变化。

希望本文能为大家在未来更好地利用生成式AI提供一些提示。

Scrapbox已改名为Cosense。（~~虽然个人还有些依恋，不想改名~~） ↩︎
Cosense提供了“QuickSearch”、“关联页面”、“2 hop search”和“全文搜索”等便捷的搜索功能。但是，当信息规模超过1万页时，找到目标页面还是变得十分困难。 ↩︎
客户和项目等带有敏感信息的链接页面不在获取范围之内。 ↩︎
RAG是Retrieve and Generate（检索与生成）的缩写，即同时进行信息检索和生成的一种AI模型。然而，在OpenAI的文档中并未使用RAG这个术语，而是将知识库称为VectorStore，将其用于搜索的功能称为File Search。 ↩︎