基于web挖掘技术IBM Modeler的信息分析

基于web挖掘技术IBM Modeler的信息分析

基于IBM Modeler的信息分析

摘要:为了能够充分的利用现有资源,实现从海量的数据中获取自己需要的知识内容,数据挖掘这项技术应运而生并充分显示出其强大的生命力。本文主要讲述了数据挖掘技术与web挖掘技术。并使用IBM Modeler软件进行的实例使用。

关键字:数据挖掘技术;IBM Modeler 

The information analysis which based on IBM Modeler

Abstract: In order to make full use of existing resources, to achieve access to knowledge content they need from the vast amounts of data, data mining of this technology came into being and fully demonstrated its strong vitality. This paper mainly introduces the technology of data mining and web mining technology. And use the Modeler software to use the example of IBM.

Key words: Data Mining Technology ;  I BM Modeler

一、前言 

在以计算机和网络为代表的信息技术的发展的今天,愈来愈多的企业、教育机构和科研单位已然成功实现了信息的数字化处理工作。数据库,特别是数据仓库已经被广泛地应用到企业管理、信息服务、产品销售和科学计算等多个领域。同时,随着大数据库的建立和海量数据的不断涌现,必然提出对强有力的数据分析工具的迫切需求。但现实情况往往是“数据十分丰富,而信息相当贫乏。

现如今,随着海量数据收集的快速增长,人们只是将其存放在大型数据库中,因为缺乏有效的工具,人们的能力已经完全满足不了数据分析的要求,只能将数据置于一处。因此,有人将其称为:“数据坟墓”。

数据搜集工具的进步使人类拥有了庞大的数据量,数据量的急剧增加,人们产生了对新型工具的需求,希望使得这些数据能够以自动化的形式转变为有价值的信息和知识。故而,数据挖掘成为了一个日益受到关注的研究重点区域。

二、数据挖掘及其技术

(一)数据挖掘概述

数据挖掘技术是一项人们通过长期进行的对数据库技术进行的研究和开发的结果的展示。人们通过人工智能的学习、结合产生了数据挖掘与其衍生出的知识。而在二十世纪末时,数据挖掘就已经有了很大的进步。而发展到现在,数据挖掘技术已经不仅仅只是一项研究。而是已经在众多领域,比如:市场分析、医疗卫生、政府管理、金融、制造业及科学探索等都得到了应用并取得了一定的实效的技术了。

数据挖掘技术是一项能够帮助人们从一堆大量的、毫无张理可言的相关数据集中提取出所需或感兴趣的知识、规律或更高层次的信息的技术,并能够帮助人们以不同的形式、不同的角度、不同的思路来分析这些数据,使人们从这些数据中找出所隐藏且有价值的内容出来。数据挖掘技术不仅仅能够用于描述过去数据的发展过程,而且还能够进一步预测出未来发展的趋势走向。

目录

一、前言 2

二、数据挖掘及其技术 2

(一)数据挖掘概述 2

(二)数据挖掘的演变 2

1.数据挖掘技术的发展 3

2.对数据挖掘的定义 4

(三)web挖掘 4

1.Web结构挖掘 5

2.Web文本挖掘 5

3.Web使用记录挖掘 5

三、IBM Modeler简介及实验分析 6

(一)IBM Modeler软件简介 6

(二)关键方法 6

(三)实验分析 7

1.关联 7

2.决策树 12

(四)实验结果及分析 19

四、小结 20

五、参考文献 22

参考文献

[1] 康晓东 著. 基于数据仓库的数据挖掘技术[M]. 北京:机械工业出版社,2004.

[2] 谭华 著. 基于遗传神经网络的CRM市场营销数据挖掘模型的研究[D]. 广西:广西大学,2003

[3] 刘涛 雪亮 著. 数据挖掘在企业决策中的应用[D]. 北京:北京科技大学,2008

[4] 高英明 著. 数据挖掘与知识发现(DMKD)及其应用的研究[D] 北京:华北电力(北京)大学,2002

[5] 黄鲁成 杨少娣 著. 论Web挖掘在新兴技术产业化潜力评估中的应用[D]. 经济论坛,2009

[6] 毛慧燕 著. 关联规则挖掘相关算法研究[D]. 武汉大学 2011

[7] 文安邦 著. 基于网络流量日志的分析与安全审计[D]. 大连海事大学 2010

[8] 包淑玮 胡军国 著. 基于数据库技术的Apriori改进算法研究与应用[D]. 浙江:浙江农业大学,2013.

[9] 梁丽琴 著. 虚占时刻航班异常延误行为研究[D]. 电子科技大学,2009


暂时没有评论

真实

多重认证,精挑细选的优质资源 优质老师。

安全

诚实交易,诚信为本。

保密

所有交易信息,都为您保密。

专业

10年专业经验,10年来帮助无数学子。