欢迎来到 常识词典网 , 一个专业的常识知识学习网站!
[ Ctrl + D 键 ]收藏本站
答案 1:
传统的聚类方法比如k-means对于高维数据的效果是很差的。因为在高维度下距离的度量包含了大量随机扰动的结果。用PCA(或者LSI)降维以后那些随机扰动所在的分量都被滤掉了,所以聚类会有提高。总的来说引入很多没有信息量又带来噪声的维度总是会让聚类变差的。 另外统计工具经过发展之后已经能够处理高维的聚类问题了,比如LDA或者人工神经网络一类的方法。答案 2:
同意劳兄的看法,鄙人一点浅显的看法是在高维空间中任何两点间的距离都是很远的,那么即便聚类后作为特征仍然未必很好。而SVD类的工具要有效地多。下一篇:HR 们如何看待应届生曾获的奖学金? 下一篇 【方向键 ( → )下一篇】
上一篇:1900 年之前有用分数表述地震震级的方法吗?如果有,是怎样表述的? 上一篇 【方向键 ( ← )上一篇】
快搜