DX技術用語辞典

by Arsaga Partners

ベクトルデータベース

読み方: ベクトルデータベース

ベクトルデータベースとは

ベクトルデータベースとは、ベクトルデータ(方向と大きさを持つ数値のセット)を格納、クエリ、検索するために設計されたデータベースです。一般的なデータベースが、テキストや数値などのスカラー値や構造化データを格納するのに対し、ベクトルデータベースは、画像や音声などの非構造化データを数値ベクトルに変換して格納します。主に画像や音声、テキストなどのデータを扱う際に使用され、類似性検索や機械学習、位置情報の処理などに役立ちます。

ベクトルデータベースの主な活用手順

例: 画像類似度検索

写真検索サイトで、特定の風景が写った写真を探したい時に活用できます。通常のデータベースでは、「空」「山」といった画像のタイトルや説明文をキーワード検索することが一般的ですが、ベクトルデータベースを使うと画像そのものに基づいて類似度を検索することができます。

1.ベクトル化

まず、求める画像と類似した画像をベクトルデータに変換します。例えば、各ピクセルの色や明るさの値を数値化し、全てのピクセルの値を一つのベクトルに結合します。

2.ベクトルデータベースに格納

このベクトルをベクトルデータベースに格納します。各画像に対応するベクトルがデータベース内に保存されます。

3.類似度検索

次に、検索したい画像のベクトルを作成します。例えば、あなたが撮った風景の写真のベクトルとデータベース内の他の画像のベクトルとの類似度を計算します。類似度が高い順に画像を取得し、それらを表示します。

この方法では、画像の特徴を直接比較することができます。例えば、山の写真を検索する際に、他の山の写真との類似度が高い写真が表示されます。このように、ベクトルデータベースを使用することで、画像のような複雑なデータの類似度検索が可能になります。

ベクトルデータベースの用途例

・類似度検索

例えば、画像、音声、テキストなどの類似したデータを検索します。上記の画像類似度検索はこれにあたります。

・機械学習

大規模なデータセットからの特徴量の高速な検索や、類似性に基づく予測モデルのトレーニングや推論に利用されます。例えば、顔認識、自然言語処理、音声認識などの分野で使用されます。

・位置情報の処理

地理情報システム(GIS)、ロケーションベースのアプリケーションにおいて、地理空間内の位置をベクトルとして表現し、その位置に関連する情報を検索するために使用されます。

・推薦システム

ユーザーの思考や行動をベクトルとして表現し、類似したユーザーまたはアイテムを推薦する際に使用されます。

現場の声

「AI領域での活用などから近年注目が高まっているベクトルデータベースには、ファイルベースでの実装、専用のインスタンス、RDBMSにプラグインとして組み込む実装など、多くのソリューションが存在します。それぞれ向いているユースケースと向いていないユースケースがあるため、比較検討し、適切なソリューションを選択することが重要です。現在自分たちが抱えている問題を分析し、比較検討を行った上で選択することを心がけましょう。」

<執筆・監修>

アルサーガパートナーズ株式会社 DX技術用語集制作チーム

(2024年3月時点)