1-10 BI、DW与DM-尚大教育软考学院

您现在的位置：首页 > 软考学苑 > 系统集成项目管理工程师 > 中项上午综合知识 > 中项考点梳理 >> 正文

正文

1-10 BI、DW与DM

来源：作者：时间;2017-11-21 16:05:05 点击数：尚大软考交流群：376154208

BI、DW与DM BI是企业对商业数据的搜集、管理和分析的系统过程，目的是使企业的各级决策者获得知识或洞察力，帮助他们做出对企业更有利的决策。BI是数据仓库、OLAP（OnLine Analytical Processing，联机分析处理）和DM（Data Mining，数据挖掘）等相关技术走向商业应用后形成的一种应用技术。 DW，即数据仓库（Data Warehouse），是一个面向主题的、集成的、非易失的、反

<尚大教育，教育至上，人才为大：sdedu.cc>

BI、DW与DM

BI是企业对商业数据的搜集、管理和分析的系统过程，目的是使企业的各级决策者获得知识或洞察力，帮助他们做出对企业更有利的决策。BI是数据仓库、OLAP（OnLine Analytical Processing，联机分析处理）和DM（Data Mining，数据挖掘）等相关技术走向商业应用后形成的一种应用技术。

DW，即数据仓库（Data Warehouse），是一个面向主题的、集成的、非易失的、反映历史变化的数据集合，用于支持管理决策。

数据仓库的特征如下：

（1）数据仓库是面向主题的。传统的操作型系统是围绕公司的应用进行组织的。如对一个电信公司来说，应用问题可能是营业受理、专业计费和客户服务等，而主题范围可能是客户、套餐、缴费和欠费等。

（2）数据仓库是集成的。数据仓库实现数据由面向应用的操作型环境向面向分析的数据仓库的集成。由于各个应用系统在编码、命名习惯、实际属性、属性度量等方面不一致，当数据进入数据仓库时，要采用某种方法来消除这些不一致性。

（3）数据仓库是非易失的。数据仓库的数据通常是一起载入与访问的，在数据仓库环境中并不进行一般意义上的数据更新。

（4）数据仓库随时间的变化性。

数据挖掘就是从存放在数据库，数据仓库或其他信息库中的大量的数据中获取有效的、新颖的、潜在有用的、最终可理解的模式的非平凡过程。

数据挖掘技术可分为描述型数据挖掘和预测型数据挖掘两种。描述型数据挖掘包括数据总结、聚类及关联分析等。预测型数据挖掘包括分类、回归及时间序列分析等。

（1）数据总结：继承于数据分析中的统计分析。数据总结目的是对数据进行浓缩，给出它的紧凑描述。传统统计方法如求和值、平均值、方差值等都是有效方法。另外，还可以用直方图、饼状图等图形方式表示这些值。广义上讲，多维分析也可以归入这一类。

（2）聚类：是把整个数据库分成不同的群组。它的目的是使群与群之间差别很明显，而同一个群之间的数据尽量相似。这种方法通常用于客户细分。由于在开始细分之前不知道要把用户分成几类，因此通过聚类分析可以找出客户特性相似的群体，如客户消费特性相似或年龄特性相似等。在此基础上可以制订一些针对不同客户群体的营销方案。

（3）关联分析：是寻找数据库中值的相关性。两种常用的技术是关联规则和序列模式。关联规则是寻找在同一个事件中出现的不同项的相关性；序列模式与此类似，寻找的是事件之间时间上的相关性，如对股票涨跌的分析等。

（4）分类：目的是构造一个分类函数或分类模型（也称为分类器），该模型能把数据库中的数据项映射到给定类别中的某一个。要构造分类器，需要有一个训练样本数据集作为输入。训练集由一组数据库记录或元组构成，每个元组是一个由有关字段（又称属性或特征）值组成的特征向量，此外，训练样本还有一个类别标记。一个具体样本的形式可表示为：（v1， v2， ...，vn；c），其中vi表示字段值，c表示类别。

（5）回归：是通过具有已知值的变量来预测其他变量的值。一般情况下，回归采用的是线性回归、非线性回归这样的标准统计技术。一般同一个模型既可用于回归，也可用于分类。常见的算法有逻辑回归、决策树、神经网络等。

（6）时间序列：时间序列是用变量过去的值来预测未来的值。

<尚大教育，教育至上，人才为大：sdedu.cc>


各省软考办
全国	北京	天津	河北	山西	上海	江苏	浙江	安徽	湖北
湖南	广东	广西	云南	西藏	江西	陕西	福建	吉林	辽宁
海南	山东	河南	重庆	甘肃	四川	贵州	青海	新疆	宁夏
内蒙古	黑龙江

来顶一下

返回首页

上一篇：1-9 电子商务是指买卖双方利用现代开放的因特网
下一篇：2-1 信息系统服务

· 1-10 BI、DW与DM

· 1-9 电子商务是指买卖双方利用现代开放的因特网

· 1-8 EAI EAI是将基于各种不同平

· 1-7 SCM 供应链是围绕核心企业，通过对信息流、物流、资金

· 1-6 CRM建立在坚持以客户为中心的理念

· 1-6 ERP就是一个有效地组织、计划和实施企业的内外

· 1-5 企业信息化一定要建立在企业战略规划基础之

· 1-4 电子政务实质上是对现有的政府形态的一种改造，

· 1-3 国家信息化体系的6个要素

· 1-2 国家信息化体系的9大战略重点

距离2023年05月27-28日软考考试还有天

尚大软考交流群：376154208

软考培训

证书用途

尚大优势

培训须知

信管培训

集成培训

信监培训

信安培训

开班计划

报名交费
软考报名预计从2023年05月27-28日陆续开始

报名条件

报名入口

报名专业

如何报考

报名流程

报名费用

常见问题

报名教程

报名动态
教材、考试大纲请使用新版教材

官方教材

考试大纲

购买教材
准考证打印预计从请使用新版教材

各省打印时间

打印入口

注意事项
软考考试2023年05月27-28日

考试时间

考场规则

考试机构

历年真题

全国考试计划
成绩查分预计为2021年5月底

查分入口

历年成绩查询

证书查询
证书领证预计为2021年5月底

领取入口

历年证书查询

证书样本

软考各地考务机构

更多>>

历年真题汇总

更多>>

各省市软考报名简章

软考动态

更多>>

系统架构设计师	系统规划与管理师	系统分析师
网络规划设计师	信息系统项目管理师

网络管理员	电子商务技术员	信息系统运行管理员	程序员
网页制作员	信息处理技术员	多媒体应用制作技术员

系统集成项目管理工程师	信息技术支持工程师	计算机硬件工程师	嵌入式系统设计师	数据库系统工程师	电子商务设计师	软件评测师	软件设计师
软件过程能力评估师	信息系统管理工程师	计算机辅助设计师	多媒体应用设计师	信息安全工程师	信息系统监理师	网络工程师