注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

瘋人院

lunatic asylum

 
 
 

日志

 
 

数据挖掘原理与算法(第二章)  

2010-01-19 13:03:02|  分类: 數據挖掘 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

第二章:知识发现过程与应用结构

2.1、知识发现的基本过程:

1)问题定义阶段:要发现何种知识;

2)数据抽取阶段:

3)数据预处理阶段:当数据挖掘的对象是数据仓库时,数据预处理一般在数据仓库生成时已经完成了,但当源数据来自多数据源时,数据预处理就是一个重要的步骤了;

4)数据挖掘阶段:选定合适的挖掘算法;

5)知识评估阶段:对发现出来的模式进行评估,剔除无关模式;若模式不满足要求,可能要回退到前续阶段,重新执行;

 

2.2、数据库中的知识发现处理过程模型

几个比较有代表性的KDD模型架构:

1、阶梯处理过程模型:

源数据—(数据选择)—>目标数据—(数据预处理)—>预处理后的数据—(数据缩减)—>缩减后的数据—(数据挖掘)—>模式—(模式解释与评估)—>知识;

每个处理阶段都可以借助相应的处理工具来完成工作;

 

2、螺旋处理过程模型

——>定义问题——>抽取数据——>清洗数据——>数据工程——>算法工程——>运行挖掘算法——>分析结果——>(循环);

 

3、以用户为中心的处理模型

该模型特别注重对用户和数据库交互的支持。

 

4、联机KDD模型

OLAMOn Line Analytical Mining,联机分析挖掘)是对OLAP的发展;需要可视化技术的支撑;

OLAM划分成若干抽象层次,每个抽象层次都有明确的任务;

 

5、支持多数据源多知识模式的KDD处理模型

 

2.3、知识发现软件或工具的发展

1、通用型数据挖掘工具

2、面向特定领域的数据挖掘工具

 

2.5、数据挖掘语言介绍

1、数据挖掘查询语言

DBMiner中的DMQLData Mining Query Language);

MSQL:一种类似SQL的语言;

 

2、数据挖掘建模语言

PMMLPredictive Model Markup Language,预言模型标记语言):一种基于XML的语言;

 

3、通用数据挖掘语言

结合上述两种语言的特点;

微软提出的OLE DB for Data MiningDM),扩充了SQL语言语法,调用API实现数据挖掘功能,与关系型数据库自然的集成;

 

4DMQL挖掘查询语言介绍

  评论这张
 
阅读(508)| 评论(0)
推荐 转载

历史上的今天

在LOFTER的更多文章

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017