结构体 faiss::ClusteringParameters

struct ClusteringParameters

聚类参数的类。 可以传递给 Clustering 对象的构造函数。

faiss::Clustering, faiss::ProgressiveDimClusteringParameters 继承

公共成员

int niter = 25

聚类迭代次数

int nredo = 1

重复聚类这么多次,并保留具有最佳目标的聚类

bool verbose = false
bool spherical = false

是否在每次迭代后标准化质心(对于内积聚类很有用)

bool int_centroids = false

每次迭代后将质心坐标四舍五入为整数?

bool update_index = false

每次迭代后重新训练索引?

bool frozen_centroids = false

使用作为输入提供的质心子集,并且在迭代期间不更改它们

int min_points_per_centroid = 39

如果每个质心提供的训练向量少于此数量,则写入警告。 请注意,每个质心少于 1 个点会引发异常。

int max_points_per_centroid = 256

限制数据集的大小,否则训练集将被二次采样

int seed = 1234

随机数生成器的种子。 负值会导致使用 std::high_resolution_clock 播种内部 rng。

size_t decode_block_size = 32768

当训练集被编码时,编解码器解码器的批处理大小

bool check_input_data_for_NaNs = true

是否检查输入数据中的 NaN

bool use_faster_subsampling = false

是否使用基于 splitmix64 的随机数生成器进行二次采样,它更快,但可能会选择重复的点。