LLM のはじめかた: Citadel AI の LLM に対するこれまでの取り組み

Filed under:

2023/09/27

Blog

この記事では弊社の LLM (Large Language Models: 大規模言語モデル) に対する取り組みについて共有します。

弊社でどのように取り組みを始めたのか共有しているため、これから取り組みを始めていく方に向けた内容となっています。

はじめに

LLM の活用に向けた活動はさまざまな組織が行っており、ニュースやブログ記事などで多数取り上げられています。一方、実際に組織内でどのように活用しているのか共有されることは少なく、活用を始めようとしても時間がかかりがちです。

その理由としては次のようなものが考えられます。

できることが多すぎる
やりたいことが多すぎる
実現のための選択肢が多すぎる

弊社では現在、LLM の活用に役立てられるようなツールを開発中ですが、いきなりそれに着手できたわけではなく、それ以前の取り組みとして LLM をテーマとしたハッカソンを社内で開催しました。

このハッカソンを通じて LLM について組織的な理解を深められたため、この記事ではどのようにハッカソンを行い、結果として得られたものについて共有します。

事前に行った準備

ハッカソンのための事前準備としては次の事項を実施しました。

LLM の現状の調査
ハッカソンで利用するための環境の準備
スケジュールの作成

LLM の現状の調査

まず、LLM の現状についての調査を行いました。

弊社のメンバーは機械学習に造詣のあるメンバーも多いのですが、自然言語処理、とくに近年の LLM の動向について熟知しているというわけではありませんでした。このため、有志で LLM について調査を行い結果を資料としてまとめました。
この資料はハッカソンの序盤で情報共有を行うために用いられました。

LLM のはじめかた: Citadel AI の LLM に対するこれまでの取り組み — LLMについての調査結果について情報共有

ハッカソンで利用するための環境の準備

ハッカソンでは実際にアプリケーションの開発を行うため、LLM を利用できる開発環境が必要です。開発環境はクラウドサービスを用いて用意しました。ハッカソンのためには次の 2 種類の環境を用意しています。

ホストされた LLM を API 経由で利用する環境
LLM を自分でホストするための環境

ホストされた LLM を API 経由で利用するのは、取り組み始めるのなら第一選択となる方法でしょう。弊社ではハッカソンのために Azure OpenAI Service を利用しました。Azure を利用しているのであれば、利用開始は比較的かんたんです。詳細は Azure の資料をご参照ください。

また、OpenAI Service 以外の LLM を自分たちでホストするための環境として、Google Cloud の Vertex AI Workbench も用意しました。

Vertex AI Workbench は Jupyter Notebook (Jupyter Lab) を実行した環境を手早く用意できる上、ユーザー管理のノートブックインスタンスを利用すれば API の実行環境としても利用できます。また、GPU の利用も容易であり、ハッカソンのための環境を手早く用意するのに向いています。

弊社では Azure や Google Cloud を日常的に用いているため上記のような環境を用意しましたが、もし別のクラウドサービスを普段利用されているのであれば、そちらで環境を用意するほうが手間取らないかもしれません。