结构体 faiss::ProgressiveDimClusteringParameters

struct ProgressiveDimClusteringParameters : public faiss::ClusteringParameters

faiss::ProgressiveDimClustering 继承

公共函数

ProgressiveDimClusteringParameters()

公共成员

int progressive_dim_steps

增量步骤的数量

bool apply_pca

在输入上应用 PCA

int niter = 25

聚类迭代的次数

int nredo = 1

重新进行聚类这么多次,并保留具有最佳目标的聚类

bool verbose = false
bool spherical = false

是否在每次迭代后对质心进行归一化(对于内积聚类很有用)

bool int_centroids = false

每次迭代后将质心坐标四舍五入为整数?

bool update_index = false

每次迭代后重新训练索引?

bool frozen_centroids = false

使用作为输入提供的质心子集,并且在迭代期间不更改它们

int min_points_per_centroid = 39

如果每个质心提供的训练向量少于此数量,则写入警告。 请注意,每个质心少于 1 个点会引发异常。

int max_points_per_centroid = 256

限制数据集的大小,否则将对训练集进行子采样

int seed = 1234

随机数生成器的种子。 负值导致使用 std::high_resolution_clock 对内部 rng 进行播种。

size_t decode_block_size = 32768

当训练集被编码时,编解码器解码器的批量大小

bool check_input_data_for_NaNs = true

是否检查输入数据中的 NaN

bool use_faster_subsampling = false

是否使用基于 splitmix64 的随机数生成器进行子采样,这更快,但可能会选择重复的点。