基于WEKA数据挖据中关联规则的分析及运用

基于WEKA数据挖据中关联规则的分析及运用

基于WEKA数据挖据中关联规则的分析及运用

摘要:数据挖掘技术现在运用的越来越广,在实际运用中已经起到了很好的效果,更多的企业会运用数据挖掘技术来改善决策和提高效率。通过使用WEKA数据挖掘软件对数据挖掘的关联规则这一方面进行具体的阐述和分析,从而对超市数据进行深入的挖掘,得到需要实现的目标和能够对超市的实际运用起到好的结果。

关键词:数据挖掘;关联规则;WEKA:置信度:支持度

 Based on the WEKA analysis in data mining association rules  and application 

Abstract:Data mining technology is more and more widely applied in practice has played a very good effect, more businesses will use and improve the efficiency of data mining techniques to improve decision making. By using WEKA data mining software for data mining of association rules which on the one hand, the concrete elaboration and analysis, to the supermarket data, in-depth mining need to achieve and to supermarkets have good results in actual application.        .

Keywords: Data mining; association; WEKA; confidence; support

目录

一、引言 1

二、数据挖掘的介绍 1

(一)数据挖掘的概念 1

(二)数据挖掘的定义 1

(三)数据挖掘的功能 2

(四)数据挖掘的应用 3

三、WEKA数据挖掘关联规则挖掘 3

(一)关联规则的概述 3

(二)关联规则的参数 3

(三)合格的关联规则 4

(四)关联规则的步骤 4

四、WEKA数据挖掘软件和实验分析 4

(一)WEKA的简介 4

(二)WEKA的操作界面 5

(三)WEKA的数据挖掘流程 7

(四)数据集来源 7

(五)实验流程介绍 8

(六)实验目的 9

(七)实验具体分析 10

(八)实验结果分析 16

五、 总结和展望 16

六、小结 18

七、参考文献 19

一、引言

在当今社会上我们队网络的需求不断扩大,可以说无论是生活还是工作我们都已经离不开网络了,但是也随着网络的发展,现在网上的数据可以说是相当的庞大。可以说是大数据时代了,这对于我们有个领域的来说要在这数据海中找到对自己有用的信息是分成不容易的,常常会因为一个数据浪费很多时间。所以对于数据挖掘的研究就非常有必要性了。我希望可以通过这次的研究能够对数据挖掘进行充分的分析,对以后的工作,生活能够起到作用。

这次我的研究是用supermarket这一数据集进行关联规则挖掘,可以从人们的购买数据中得出相应的规则可以对在超市的布局进行一个重新的规划,从而可以提高超市物品的销售量和营业额。

二、数据挖掘的介绍  

  (一)数据挖掘的概念

数据挖掘是从大型数据集中发现可行信息的过程。数据挖掘使用数学分析来派生存在于数据中的模式和趋势。通常,由于这些模式的关系过于复杂或涉及数据过多,因此使用传统数据浏览无法发现这些模式。这些模式和趋势可以被收集在一起并定义为“数据挖掘模型”。[6]   

(二)数据挖掘的定义

数据挖掘是从大量的,不完全的,有噪音的,模糊的,随机的数据集中识别有效的,新颖的,潜在有用的,以及最终理解模式的非凡过程。它是一门涉及面很广的交叉学科,包括机器学习,数理统计,神经网络,数据库,模式识别,粗糙集。模糊数学等相关技术。[5]

知识是什么?从广义上理解:数据和信息是知识的一种表示,但是人们却只把概念,模式和约束来代表知识。作为知识的来源数据,就好比是从原矿中淘金是一样的。原始数据逆光可以是结构化的,如关系数据库中的数据;也可以是半结构化的,如文本,图形和图像数据;也可以是均匀分布的异构型网络上的数据。发现知识的方法可以是数学的,也可以不是数学的;可以是演绎的,也可以是概括的。通过发现知识可以知道知识被用于信息管理,查询优化,决策支持,过程控制等,还可以用于维护数据本身。因此,数据挖掘是一门交叉学科,它把人们对只可以使用数据对应用程序简单查询的低水平的状态,提升到可以数据挖掘知识,提供决策支持的高水平状态。[5]

现在根据需求汇集了不同领域的研究人员,特别是数据库技术,人工智能技术,数理统计和可视化技术等的学者和工程技术人员对新兴数据挖掘领域的研究,从而形成新的技术热点。[5]

知识发现,不是要求发现普遍的真理,也不是找到一个新的自然科学和纯粹的数学公式定理,也不是机器定理证明。事实上,所有的知识发现都是相对的,是有前提和约束的,是要对于特定的领域的,同时还需要通过用户的,使用户能容易理解的。最好能用自然语言表达从中得出结果。[5]

数据挖掘技术在商业方面的定义,就是我们需要从一大堆商业数据中进行抽取,转换,分析和模式化处理,从中可以得到有用的业务数据,对商业的决策有着至关重要的作用,可以形成一个有用的商业模式。

参考文献

[1]  王彦增,曹正.基于WEKA数据挖掘中关联规则的分析及应用举例[J].经济论坛,2013.

[2]  林莉莉.基于JAVA的WEKA数据挖掘平台分析及二次开发[D].河南大学,2007

[3]  fanwei.数据挖掘的六大主要功能[J].CIO时代网.2012.

[4]  豆丁网.WEKA_关联规则实验.http://www.docin.com/p-652976864.html.

[5]  黄跃.数据挖掘的含义.http://abc.wm23.com/yaoyao9457/218783.html.

[6]  Microsoft.数据挖掘概念.https://msdn.microsoft.com/zh-cn/library/ms174949.aspx.

[7]  袁梅宇.数据挖掘与机器学习-WEKA应用技术与实践[M].清华大学出版社,2014.

[8]  阮鸣梁,陈维默.数据挖掘技术的发展与应用[A].福建省论文集.2005.

[9]  王艳.数据挖掘在数字图书馆中的应用[J].情报科学.2003年第02期.

[10]  王学辉,贾丽丽.WEKA,使数据挖掘不再神秘[J].电脑知识与技术(学术交流).2007.


暂时没有评论

真实

多重认证,精挑细选的优质资源 优质老师。

安全

诚实交易,诚信为本。

保密

所有交易信息,都为您保密。

专业

10年专业经验,10年来帮助无数学子。