作者:张绍群流形学习等距映射地标点紧性
摘要:2000年以后新兴了一系列非线性降维的方法,流形学习中的Isomap就是其中的代表。该算法能够反映数据集的全局结构且简单高效,但是存在低维流形等距的欧氏子集必须是凸集和计算复杂度高等缺点。L-Isomap成功降低了算法的计算复杂度,但是对于地标点(landmark points)的选取大多采用随机的方法,致使该算法不稳定。依据拓扑学和泛函分析中有限维空间有界闭集与紧集(compact set)等价、紧集的任一开覆盖存在有限子覆盖等经典定理,分析数据集所在区域的拓扑结构,确定了一系列能够反映数据结构的地标点。这样的方法计算复杂度低,比L-Isomap稳定,且将数据集是凸集的要求弱化到紧集(有界闭集),避免了传统Isomap算法放大不完整流形中的“空洞”误差等问题。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社