数据的预处理是指对所收集数据进行分类或分组前所做的审核、筛选、排序等必要的处理;主要方法有数据清理。数据集成。数据变换。数据归约等。
数据清理;数据清理例程通过填写缺失的值、光滑噪声数据、识别或删除离群点并解决不一致性来“清理”数据。主要是达到如下目标:格式标准化。异常数据清除。错误纠正。重复数据的清除。数据集成;数据集成例程将多个数据源中的数据结合起来并统一存储。建立数据仓库的过程实际上就是数据集成。数据变换;通过平滑聚集。数据概化。规范化等方式将数据转换成适用于数据挖掘的形式。数据归约;数据挖掘时往往数据量非常大。在少量数据上进行挖掘分析需要很长的时间。数据归约技术可以用来得到数据集的归约表示。它小得多。但仍然接近于保持原数据的完整性。并结果与归约前结果相同或几乎相同。
热门文章简读《我怎么无法在金太阳里注册账号》
金太阳并不是所有的人都用金太阳,只是国信证券的,手机炒股软件在国信证券开户,就可以登录使用不同的。证券公司提供的手机炒股软件都不一样。要用金太阳,就去国信证券开户,开户要亲自去营
ps:如果对本文感兴趣,可在本站搜索标题来进行深层次阅读
以上就是由优质生活领域创作者 浪漫秀雅 整理编辑的,如果觉得有帮助欢迎收藏转发~
本文地址:https://www.jwshe.com/461206.html,转载请说明来源于:嘉文社百科网
声明:本站部分文章来自网络,如无特殊说明或标注,均为本站原创发布。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。分享目的仅供大家学习与参考,不代表本站立场。