WEDにおけるVertex AI Vector Searchの活用事例
WED株式会社 / Chikashi Nobata
メンバー / 機械学習エンジニア / 従業員規模: 11名〜50名 / エンジニア組織: 11名〜50名
利用機能 | ツールの利用規模 | ツールの利用開始時期 | 事業形態 |
---|---|---|---|
ベクトル検索 | 10名以下 | 2023年12月 | B to B B to C |
利用機能 | ベクトル検索 |
---|---|
ツールの利用規模 | 10名以下 |
ツールの利用開始時期 | 2023年12月 |
事業形態 | B to B B to C |
アーキテクチャ
アーキテクチャの意図・工夫
現状、BigQueryを入力、出力双方の格納先として、全体的にほぼ自動で行えるようなアーキテクチャになっています。IDの付与は日次で行っていますが、必要に応じて手動で実行することもでき、また検索に用いるインデックスデータの更新も同様にスケジュール実行と手動実行の双方で行えるようになっています。
導入の背景・解決したかった問題
導入背景
ツール導入前の課題
レシート中に表記されている商品名に最も適切な商品を示すJANコードなどのIDを付与するシステムを構築しようとしていました。ベクトル検索を用いることで実装できそうな手応えはありましたが、日々数十万枚のレシートデータに対し、効率よく安定してIDコード付与を行えるようにする必要がありました。
どのような状態を目指していたか
日々アップロードされるレシートデータ中の各商品名に、数百万個の商品のデータベースから最も適切なIDを付与できること、さらにその商品データベースを定期的に更新し、新商品にも容易に対応できることを目指していました。
比較検討したサービス
- Faiss library by Meta
- Myscale
比較した軸
- 運用時の速度とコストのバランス
- サービスの管理のしやすさ
選定理由
他に比較したサービスと比較して、同程度の精度を保ちつつ高速であり、費用・運用面でのコストにおいて優位であったため選定しました。
導入の成果
改善したかった課題はどれくらい解決されたか
実現したかった、日々のレシートデータ中の商品名に対し安定してIDコード付与を行う環境を実現することができました。また、別途過去のレシートデータに対し遡ってIDコード付与処理を行うこともできるようになりました。
どのような成果が得られたか
現状まだ改善の余地はありますが、ある程度の精度で対象とするレシートデータにIDコード付与ができています。また、名前空間機能を使ってインデックスを選択的に適用することで、ベクトル検索にフィルタをかけることもできています。さらに、ベクトルインデックスを恒常的に更新することもCloud Composerを利用して容易にできるようになりました。
導入時の苦労・悩み
試行錯誤で適切な設定を探る必要があり、またベクトル検索を用いるために実行時に商品名をベクトルに変換する部分を別途実装して連携させる必要がありました。これらはCloud Run Jobsを用いて連携することで解決できました。
導入に向けた社内への説明
上長・チームへの説明
導入前にPoCとして実際にFaiss Libraryを用いた処理とVertex AI Vector Searchを用いた処理を実装し、ID付与の精度や速度、運用コストを比較しました。その結果精度はほぼ同程度であること、一方で速度はGPUを使わなくてもVector Searchの方が高速であり、かつ実運用のための実装もより容易であることを説明しました。
活用方法
チームで利用しており、IDの付与は日次、インデックスデータの更新は週次で行なっています。
よく使う機能
Vertex AI Vector Search 商品名に対するIDコード付与に用いる
Cloud Run Jobs 商品名のベクトルへの変換
Cloud Composer IDコード付与の処理、商品ベクトルインデックスの更新
ツールの良い点
- 大規模なデータも高速に処理できる
- 計算リソースを柔軟に変更できる
ツールの課題点
- ドキュメントが整備されていない(英語版にあって日本語版にない記述があったりする)
ツールを検討されている方へ
状況に応じてデータを更新したり設定を変更したりする柔軟性があるぶん選択肢が多いので、実運用前に小さいインスタンス・データで実際に複数の設定でテストするのが良いかと思います。
今後の展望
Vertex AI には新しい機能が随時追加されているので、今後も必要に応じてそれらを利用していきたいと考えています。
WED株式会社 / Chikashi Nobata
メンバー / 機械学習エンジニア / 従業員規模: 11名〜50名 / エンジニア組織: 11名〜50名
よく見られているレビュー
WED株式会社 / Chikashi Nobata
メンバー / 機械学習エンジニア / 従業員規模: 11名〜50名 / エンジニア組織: 11名〜50名
レビューしているツール
目次
- アーキテクチャ
- 導入の背景・解決したかった問題
- 活用方法