K-D Tree 的应用场景有哪些?

摘要:部分发表于洛谷。 简介: K-D Tree 是一种适用于 (k) 维空间信息处理的数据结构,一般是维护 (n) 个点的信息,建出平衡二叉树;在 (k) 比较小的 建树: 一般使用交替建树,递归的分为以下三个步骤: 交替选择一个维
部分发表于洛谷。 简介: K-D Tree 是一种适用于 \(k\) 维空间信息处理的数据结构,一般是维护 \(n\) 个点的信息,建出平衡二叉树;在 \(k\) 比较小的 建树: 一般使用交替建树,递归的分为以下三个步骤: 交替选择一个维度切割(即 \(x, y, z, \cdots\) 依次切一遍,最后回到 \(x\) 继续切)。 选择一个切割点将这个维度切割了。 然后递归到被切割点切开的两个超立方体继续切割,直到区域内没有点。 一个切割点的左右儿子是其切开的两个超立方体的切割点。 为了维持二叉树的平衡,要左右子树尽量均匀,所以一般选择这个切割维度的中位数作为切割点。 此时得到的树高显然是 \(\log n + O(1)\) 级别的。 为了方便理解,给定一个在二维平面的例子: 此时建出的 K-D Tree 就是: 可以使用 nth_element 辅助建树,时间复杂度为 \(O(n \log n)\)。 为了方便操作,对于每个点,可以维护其被切割时的超立方体,即可以记录其子树内每个维度的最大最小值。 最近点对: 即对于每个点,求出到其它点的最短距离。 设查询点是 \(a\),依然是递归的形式的从 \(rt\) 进入(设当前到了 \(p\)): 先用 \(\operatorname{dis}(a, p)\) 更新答案 \(ans\)。 然后求出 \(p\) 到左右子树所代表的超立方体的最短距离 \(disl, disr\),如果大于 \(ans\),则直接剪枝。 否则进入 \(disl, disr\) 更小的那个子树先更新,出来时再判断是否比另外一个更优;这是估价型剪枝。 提示: 使用 K-D Tree 单次查询最坏是 \(O(N)\) 的,但是如果没有特意卡的情况下,还是可以骗到很多分的。 操作: 对于一个高维矩形 \(Q\) 内的点的查询,可以递归式的从 \(rt\) 开始判断(设当前到了 \(p\)): 若包含 \(p\) 子树,则直接返回所有点的信息。 若与 \(p\) 子树所在超立方体有交,先考虑 \(p\) 本身的贡献,然后递归到左右子树处理。 否则无交,直接退出。 考虑时间复杂度分析,先考虑二维情况,根据递归,显然时间复杂度是跟与 \(Q\) 相交的点(且没有被 \(Q\) 包含)的数量,将这些点分为两类: 完全包含 \(Q\):即树上一条到根的链,点数是 \(O(h) = O(\log n)\) 的。 部分与 \(Q\) 相交:显然这些点所代表的矩形互不相交。 考虑求与 \(Q\) 相交的矩形的数量,显然这些与 \(Q\) 相交的矩形必然至少与一条 \(Q\) 的边相交;于是可以转化为与一条边相交的矩形的数量: 考虑一个点 \(p\) 所代表的矩形,通过两次切割将这个矩形分为了四个部分,每个部分为 \(p\) 的孙子来表示,而一条平行于坐标轴的直线显然最多穿越这个四个部分中的两个部分。 这里阐述了要交替维度切割建树的原因,因为如果不交替切割,一条直线可能会直接穿过这四个部分。 因为子树大小几乎是严格的一半,于是可以得到递推式子: \[T(n) = 2T(\frac{n}{4}) + O(1) \] 得到 \(T(n) = \sqrt n\);拓展到 \(k\) 维上,类似的,是 \(T(n) = 2^{k - 1} T(\frac{n}{2^k}) + O(1)\),于是 \(T(n) = O(n^{1 - \frac{1}{k}})\)(这里是将 \(k\) 当做常数计算的,实际上常数要大不少)。 插入/删除: 先说删除,比较简单,不需要真的将这个点删除,就把这个点打上懒标记,将其贡献清除即可,时间复杂度是 \(O(h) = O(\log n)\) 的;如果要真删的话,也可以用下面的重构方法。 如果直接插入,就是递归式的,根据是否在左右子树的超立方体内判断插入到哪里,最后到达空节点。 但是这样可能会导致二叉树不平衡,使得查询复杂度出错;然后大家可能会想到替罪羊树的方法,定义一个平衡因子 \(\alpha\),如果子树大小超了,就子树重构,可以保证树高是 \(O(\log n)\) 的。 但是请注意,复杂度分析中,其四个孙子最多只有两个孙子被算进去,同时根据儿子子树严格减半,可以得到递推式;而替罪羊树的方法,只保证了树高是 \(O(\log n)\) 的,没有保证子树节点数量,所以若那条 \(Q\) 中的线恰好穿过四个孙子中两个子树最大的孙子,复杂度将会被卡满出问题,具体复杂度不太清楚,但是应该能卡? 于是可以想到两种著名的重构算法: 根号重构。
阅读全文