数据挖掘或数据挖掘是通过大型数据集进行分类以识别模式并建立关系以通过数据分析解决问题的过程。数据挖掘工具使公司可以预测未来的趋势。
在数据挖掘中,通过分析数据的频繁模式,使用支持和置信度标准来定位数据中最重要的关系来创建关联规则。支持是项目在数据库中出现的频率,而置信度是语句正确的次数。
其他数据挖掘参数包括序列或路由分析,分类,聚类和预测。序列或路径分析参数查找其中一个事件导致另一后续事件的模式。序列是项目集的有序列表,是许多数据库中常见的数据结构类型。分类参数寻找新的模式,并且可能导致数据组织方式的改变。该分类算法基于数据库中的其他因素,预测变量。
分组参数可以直观地找到并记录先前未知事实的组。分组对一组对象进行分组,并根据它们之间的相似程度进行聚合。
用户可以使用不同的方式来部署集群,从而在每个集群模型之间进行区分。鼓励数据挖掘中的参数可以发现数据中的模式,这些模式可以导致对未来的合理预测,也称为预测分析。
数据挖掘技术被用于许多研究领域,包括数学,控制论,遗传学和市场营销。尽管数据挖掘技术是提高效率和预测客户行为的一种手段,但如果使用得当,则企业可以通过使用预测性分析将自己与竞争区分开。
Web挖掘是客户关系管理中使用的一种数据挖掘,它通过Web集成了通过传统数据挖掘方法和技术收集的信息。Web挖掘旨在了解客户行为并评估特定网站的有效性。