数据挖掘是什么,数据挖掘是什么?不是什么?

数据挖掘是什么?不是什么? - 故障解答 - 电脑教程网

数据挖掘是什么?不是什么?

日期:2007-03-26   荐:
“数据挖掘是通过仔细分析大量数据来揭示有意义的新的关系、模式和趋势的过程。它使用模式认知技术、统计技术和数学技术。”--Gartner Group

  对数据挖掘有许多不同的定义,但他们几乎都使用日益增强的计算技术和高级统计分析技术来揭示大型数据库中的可用关系。

  有些定义把数据挖掘定位于特定的分析技术,如神经网络、基因算法等等。如果按这种方式定义,通常还会伴随着这样的承诺,即在所有类型的数据库上以最小的投入得到难以置信的结果。但是,这种定义并不适合于那些工作于现实世界的机构。没有一种技术比所有其他技术都好。

  “数据挖掘是一个从大型数据库中提取以前不知道的可操作性信息的知识挖掘过程。”--Aaron Zornes, The META Group

  一定的技术适合于一定类型的数据。通常,最好的结果是由多种技术的结合来实现的。就像木匠用各种工具建造一个坚固的房屋一样,一个好的分析员也会使用多种技术来把数据转化为可用信息。

数据挖掘所使用的的技术

  有人把数据挖掘的定义和数据仓库混淆在一起。数据仓库和数据挖掘是相互补充的。数据仓库用于存储数据,而不是把它变为信息,而后者正是数据挖掘所要做的。

  毫无疑问,那些只建立数据仓库而不进行数据挖掘的机构并不能从对数据仓库的投资中得到较好的回报。就像买了一台立体声唱机,却没有扬声器,同样不能听到音乐。

  还有一些人把数据挖掘比喻为“新瓶装老酒”。他们认为数据挖掘只不过是把多年以前就开始使用的陈旧的数据分析换了一个时髦的名词而已。这种说法有一些是事实,但是争论的焦点并不在这里。

  今非昔比,一些相关事件的发生引起了巨大的改变,并清除了我们多年以前就一直徘徊在其周围的高级分析技术的障碍,而且产生了大量新的技术。这些关键因素使更多的人可以进行以前根本无法实现的数据挖掘。

更多更好地访问数据
计算能力戏剧化地提高,尤其是在知识工作者平台
更多的相关培训:多数专业人员至少在统计学方面得到培训
软件实用性戏剧性的变化,包括图形化用户界面、向导、教练和界面定制,所有这些使学习曲线变得平滑
  而且,步伐越来越快,竞争越来越激烈,市场国际化,促使我们把重点放在更有针对性的市场。这要求人们不断去尝试新的东西以保持不败。企业再也不能把高级分析当作手工艺术品来对待了。功能强大并易于使用的的个人计算机已经把建模工作实用化,并使更多的人能够尝试更多的技术,更快地建立更好的模型。数据挖掘的根源在数据分析,这是事实,但许多重要的内容发生了戏剧性的变化。

机会就在您的数据中
  数据挖掘发现数据中的模式,但这只是开始。数据挖掘不做决策,决策要由人来做。数据挖掘最重要的因素是知识和经验。用更好的信息来武装自己,您可以充分发挥创造力和判断力,做出更好的决策,达到更好的效果。最好的数据挖掘软件为您处理技术细节,让您把精力集中在如何决策上。

最好的数据挖掘软件还应做到:
提供多种技术,使您可以联合使用这些技术
涵盖高级技术,为您提供更高质量的信息
自动进行处理,使您可以更快地作出决策
以易于理解的方式给出结果
数据挖掘是一次旅行
  非常幸运,路线已经知道并有专家作向导。而且,与您上一次度假不同,数据挖掘旅行得到的比您支付的还要多。如果您已经开始数据挖掘,您会不断发现新的方式来省钱和挣钱。

  和多数其他旅行者一样,数据挖掘人员在心中也有一个方向。他们典型的目标是找到能够帮助他们做出对其成功至关重要的决策的信息。例如,他们想知道这样一些情况:“那些现有客户会对我们新的产品感兴趣?”,“这个贷款申请有合理的信用风险吗?”由于数据挖掘的基础是数据 -- 关于业务中已发生事情的实际情况,它使您能够从经验中进行发掘,以做出更好的决策。一个决策定出以后,还有其他重要的决策等着您来作。新的旅行又开始了。
标签: