TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2025116398
公報種別
公開特許公報(A)
公開日
2025-08-08
出願番号
2024010798
出願日
2024-01-29
発明の名称
生成方法、探索方法、および生成装置
出願人
キオクシア株式会社
代理人
弁理士法人酒井国際特許事務所
主分類
G06F
16/903 20190101AFI20250801BHJP(計算;計数)
要約
【課題】メモリ使用量が少ない探索動作を可能にするインデックス情報の生成方法、当該インデックス情報を用いた探索方法、および生成装置を提供すること。
【解決手段】生成方法は、設定することと、ライトすることと、を含む。設定することは、探索範囲に含まれる複数の第1ベクトルに対応した複数の第1ノードのうちの1つを第2ノードとして設定することである。ライトすることは、第2ベクトルと、第2ノードの出隣接ノードである1以上の第3ノードのそれぞれについてIDおよび第3ノードに対応するベクトルである第3ベクトルと、を含む情報片をライトすることである。第2ベクトルは、複数の第1ベクトルのうちの第2ノードに対応した第1ベクトルである。情報片は有向グラフに対応したインデックス情報のうちの第2ノードにかかる要素である。
【選択図】図6
特許請求の範囲
【請求項1】
有向グラフで表されるデータを処理するように構成されたプロセッサによる生成方法であって、
前記有向グラフに含まれるそれぞれIDがアサインされた複数の第1ノードであって探索範囲に含まれる複数の第1ベクトルに対応した複数の第1ノードのうちの1つを第2ノードとして設定することと、
前記複数の第1ベクトルのうちの前記第2ノードに対応した第1ベクトルである第2ベクトルと、前記複数の第1ノードのうちの前記第2ノードの全ての出隣接ノードである1以上の第3ノードのそれぞれについてIDおよび第3ベクトルと、を含む情報片をライトすることと、前記第3ベクトルは前記第3ノードに対応するベクトルであり、前記情報片は前記有向グラフに対応したインデックス情報のうちの前記第2ノードにかかる要素である、
を含む生成方法。
続きを表示(約 1,900 文字)
【請求項2】
前記第3ベクトルは、前記第3ノードに対応する第1ベクトル、又は前記第3ノードに対応する前記第1ベクトルを圧縮することで生成されるベクトルである、
請求項1に記載の生成方法。
【請求項3】
複数回の第1動作を実行することをさらに含み、前記複数回の第1動作のそれぞれは、前記設定すること、および前記ライトすることを含み、
前記複数回の第1動作のそれぞれにおいて、前記設定することは、前記複数の第1ノードのうちのまだ前記第2ノードとして設定されていない第1ノードを設定し、
前記複数回の第1動作は、前記第2ノードとして設定されていない第1ノードがなくなるまで実行される、
請求項1に記載の生成方法。
【請求項4】
前記ライトすることは、前記第2ノードの出隣接ノードの数を前記情報片に追加することを含む、
請求項1に記載の生成方法。
【請求項5】
複数回の第1動作を実行することをさらに含み、前記複数回の第1動作のそれぞれは、前記設定すること、および前記ライトすることを含み、
前記複数回の第1動作のそれぞれにおける前記ライトすることは、複数の第1記憶領域のうちのそれぞれ異なる第1記憶領域に前記情報片をライトすることであり、
前記複数の第1記憶領域のそれぞれはストレージデバイスへのアクセスの単位に対応する、
請求項1から請求項4の何れか一項に記載の生成方法。
【請求項6】
クエリを取得することと、
インデックス情報によって規定された有向グラフに沿って前記クエリに最も近い第1ノードの候補を設定することと、前記有向グラフは探索範囲である複数の第1ベクトルに対応した複数の第1ノードを含み、前記インデックス情報がストレージデバイスに格納され、前記インデックス情報は複数の第1情報片を含み、前記複数の第1情報片のそれぞれは前記複数の第1ベクトルのうちの1つの第1ノードに対応する第1ベクトルである第2ベクトルと前記複数の第1ノードのうちの前記1つの第1ノードの全ての出隣接ノードである1以上の第2ノードのそれぞれについてIDおよび第3ベクトルを含み、前記第3ベクトルは前記第2ノードに対応するベクトルであり、
を含み、
前記候補を設定することは、前記候補の第1ノードである第3ノードにかかる第1情報片である第2情報片を前記ストレージデバイスへのアクセスの単位に対応する第1の記憶領域からリードして、リードされた前記第2情報片を前記ストレージデバイスよりもアクセスの動作が高速なメモリに格納することと、
前記メモリに格納された前記第2情報片に含まれる1以上の前記第3ベクトルに基づいて新たな候補の第1ノードを設定することと、
を含む探索方法。
【請求項7】
前記第3ベクトルは、前記第2ノードに対応する第1ベクトル、又は前記第2ノードに対応する前記第1ベクトルを圧縮することで生成されるベクトルである、
請求項6に記載の探索方法。
【請求項8】
前記メモリに前記第2情報片が格納された後、格納された前記第2情報片に含まれる第1ベクトルを用いて前記候補の第1ノードと前記クエリとの距離を計算することと、
前記候補として設定されたことがある複数の第1ノードのそれぞれと前記クエリとの複数の前記距離に基づいて前記クエリに最も近いベクトルを特定することと、
をさらに含む請求項6に記載の探索方法。
【請求項9】
それぞれIDがアサインされた複数の第1ノードを含む有向グラフおよび探索範囲に含まれる複数の第1ベクトルを受信するように構成されたインタフェース回路と、前記複数の第1ノードは前記複数の第1ベクトルに対応し、
前記複数の第1ノードのうちの1つを第2ノードとして設定することと、
前記複数の第1ベクトルのうちの前記第2ノードに対応した第1ベクトルである第2ベクトルと、前記複数の第1ノードのうちの前記第2ノードの全ての出隣接ノードである1以上の第3ノードのそれぞれについてIDおよび第3ベクトルと、を含む情報片をライトすることと、前記第3ベクトルは前記第3ノードに対応するベクトルであり、前記情報片は前記有向グラフに対応したインデックス情報のうちの前記第2ノードにかかる要素である、
を実行するように構成されたプロセッサと、
を備える生成装置。
発明の詳細な説明
【技術分野】
【0001】
本実施形態は、生成方法、探索方法、および生成装置に関する。
続きを表示(約 2,200 文字)
【背景技術】
【0002】
グラフベースの近似最近傍探索アルゴリズムの一つとして、DiskANN(Disk-based Approximate Nearest Neighbor search)というアルゴリズムが知られている。DiskANNによれば、探索の範囲である多次元ベクトル群のうちのそれぞれの多次元ベクトルをノードと見なして有向グラフが作成され、この有向グラフの構造に基づいて生成されたインデックス情報がストレージデバイスに格納される。そして、ストレージデバイス内の当該インデックス情報に基づき、有向グラフに沿った探索動作が行われる。
【先行技術文献】
【非特許文献】
【0003】
Suhas Jayaram Subramanya, Devvrit, Rohan Kadekodi, Ravishankar Krishaswamy, and Harsha Vardhan Simhadri, “DiskANN: Fast Accurate Billion-point Nearest Neighbor Search on a Single Node”, [online], November 2019, NeurIPS, [retrieved on 2022-12-11], retrieved from the Internet: <URL: https://suhasjs.github.io/files/diskann_neurips19.pdf>
【発明の概要】
【発明が解決しようとする課題】
【0004】
一つの実施形態は、メモリ使用量が少ない探索動作を可能にするインデックス情報の生成方法、当該インデックス情報を用いた探索方法、および生成装置を提供することを目的とする。
【課題を解決するための手段】
【0005】
一つの実施形態によれば、生成方法は、有向グラフで表されるデータを処理するように構成されたプロセッサによる生成方法である。生成方法は、設定することと、ライトすることと、を含む。設定することは、探索範囲に含まれる複数の第1ベクトルに対応した複数の第1ノードのうちの1つを第2ノードとして設定することである。複数の第1ノードは、有向グラフに含まれるそれぞれIDがアサインされた複数のノードである。ライトすることは、第2ベクトルと、1以上の第3ノードのそれぞれについてIDおよび第3ノードに対応するベクトルである第3ベクトルと、を含む情報片をライトすることである。第2ベクトルは、複数の第1ベクトルのうちの第2ノードに対応した第1ベクトルである。1以上の第3ノードは、複数の第1ノードのうちの第2ノードの全ての出隣接ノードである。情報片は有向グラフに対応したインデックス情報のうちの第2ノードにかかる要素である。
【図面の簡単な説明】
【0006】
実施形態の探索装置の構成の一例を示す模式的な図。
実施形態にかかる有向グラフおよびインデックス情報の構成を説明するための図。
実施形態の探索装置が探索を実行する際にSSDおよびDRAMに格納されている情報の一例を説明するための模式的な図。
実施形態の生成装置の構成の一例を示す模式的な図。
実施形態の生成装置が備えるプロセッサが実現する機能の一例を示す模式的な図。
実施形態の生成装置の動作の一例を示すフローチャート。
実施形態の探索装置が備えるプロセッサが実現する機能の一例を示す模式的な図。
実施形態の探索装置の動作の一例を示すフローチャート。
変形例1にかかるノード情報の構成の一例を示す図。
変形例2にかかるノード情報の構成の一例を示す図。
【発明を実施するための形態】
【0007】
以下に添付図面を参照して、実施形態にかかる生成方法、探索方法、および生成装置を詳細に説明する。なお、これらの実施形態により本発明が限定されるものではない。
【0008】
(実施形態)
まず、実施形態の探索方法が実行される装置(探索装置と表記する)の例を説明する。図1は、実施形態の探索装置の構成の一例を示す模式的な図である。
【0009】
図1に示す例では、探索装置2は、プロセッサ21、インタフェース22、SSD(Solid State Drive)23、DRAM(Dynamic Random Access Memory)24、およびバス25を備える。プロセッサ21、インタフェース22、SSD23、およびDRAM24は、バス25に電気的に接続される。
【0010】
インタフェース22は、探索装置2に対して情報を入出力するための装置である。インタフェース22は、ネットワークを介した通信のためのインタフェース、記憶装置が接続され得るインタフェース、キーボードなどの入力装置が接続され得るインタフェース、などを含む。探索装置2は、インタフェースを介してクエリの入力を受け付けることができる。
(【0011】以降は省略されています)
この特許をJ-PlatPatで参照する
関連特許
個人
裁判のAI化
27日前
個人
フラワーコートA
6日前
個人
情報処理システム
1か月前
個人
介護情報提供システム
13日前
個人
設計支援システム
19日前
個人
設計支援システム
19日前
株式会社サタケ
籾摺・調製設備
1か月前
株式会社カクシン
支援装置
22日前
個人
アンケート支援システム
8日前
個人
備蓄品の管理方法
1か月前
個人
ジェスチャーパッドのガイド部材
12日前
サクサ株式会社
中継装置
1か月前
キヤノン株式会社
情報処理装置
1か月前
キヤノン株式会社
情報処理装置
1か月前
サクサ株式会社
中継装置
9日前
東洋電装株式会社
操作装置
1か月前
アスエネ株式会社
排水量管理方法
1か月前
東洋電装株式会社
操作装置
1か月前
個人
リテールレボリューションAIタグ
5日前
株式会社アジラ
移動方向推定装置
7日前
株式会社寺岡精工
システム
12日前
日本電気株式会社
システム及び方法
21日前
株式会社アザース
企業連携システム
13日前
飛鳥興産株式会社
物品買取システム
1日前
株式会社リ・パワー
電力入札システム
9日前
ブラザー工業株式会社
プリンタ
今日
個人
会話評価装置
19日前
アスエネ株式会社
廃棄物排出量管理方法
1か月前
株式会社セラク
集出荷方法及びシステム
20日前
個人
竹資源の生産・販売・分配システム
16日前
株式会社創造工舎
提示項目確認システム
7日前
株式会社NONAME
物々交換システム
1か月前
国立大学法人大阪大学
漏洩情報抑制回路
19日前
株式会社mov
情報処理システム
21日前
本田技研工業株式会社
画像処理装置
12日前
太陽誘電株式会社
感覚提示システム
今日
続きを見る
他の特許を見る