考研院校库 > 西南财经大学 > 考研大纲 > 正文

西南财经大学2018年817数据挖掘综合硕士研究生入学考试大纲

作者:聚创西财大考研网-小厦老师 点击量: 1633 发布时间: 2017-09-19 16:03 【微信号:扫码加咨询】

  据悉,西南财经大学2018年817数据挖掘综合硕士研究生入学考试自命题科目考试大纲目前已公布,聚英考研网小编为大家整理了相关信息,具体内容如下:

  考试科目:数据挖掘

 第一部分:考试内容及要求

  一.数据挖掘概述

  考试内容

  数据挖掘的概念 知识发现过程 数据挖掘与传统数据分析 数据挖掘数据类型 数据挖掘功能和模式 数据挖掘可利用的技术 数据挖掘应用 数据挖掘的主要问题

  考试要求

  1.了解数据库系统技术的演变过程;理解数据挖掘的概念;掌握知识发现过程的7个步骤。

  2.理解数据挖掘与传统数据分析的区别; 掌握数据挖掘的数据类型;掌握数据挖掘功能和模式;了解数据挖掘可利用的技术;了解数据挖掘的应用领域;了解数据挖掘的主要问题。

 二.数据预处理

  考试内容

  数据预处理概述 数据质量  数据预处理的主要步骤  数据基本描述统计 数据清理 数据集成 数据变换 数据规约 数据离散化

  考试要求

  1.了解进行数据预处理的原因及其重要性;了解数据质量涉及的因素;掌握数据预处理的主要步骤。

  2.理解数据的基本统计描述,掌握均值、中位数、众数、极差、四分位数、方差、标准差和四分位数极差的概念和计算方法;了解数据基本统计描述的图形显示。

  3.了解数据清理的任务;了解处理数据缺失值的方法;了解处理噪音数据的方法。

  4.理解数据集成的概念;掌握冗余和相关性分析的方法(检验,Pearson积矩系数)。

  5.了解数据变换的策略;掌握数据规范化的计算方法(最小-最大规范化、z分数规范化、按小数定标规范化)。

  6.理解数据规约的概念;了解数据规约的策略;理解数据立方体聚集、属性子集选择、数据压缩、小波变换、主成分分析法等概念;了解线性回归、对数线性模型、直方图、聚类、抽样等数据规约方法。

  7.理解数据离散化和概念分层的概念;了解数据离散化的方法(分箱、直方图分析、聚类分析、相关分析);了解数据概念分层的产生方法。

  三.数据仓库和联机分析处理

  考试内容

  数据仓库基本概念  OLTP和OLAP 数据立方体 数据仓库的数据模型 概念分层 典型的OLAP操作 数据仓库的设计 数据仓库的实现 数据仓库和数据挖掘

  考试要求

  1.理解数据仓库的概念和关键特征;了解OLTP和OLAP的概念和主要区别。

  2.理解数据立方体的概念;了解数据仓库的数据模型(星型模式、雪花模式、事实星座模式);理解概念分层的概念和作用;了解典型的OLAP操作方法。

  3.了解数据仓库设计的四种视图, 了解数据仓库的设计过程和步骤;理解数据立方体的有效计算;理解如何使用位图索引和连接索引对OLAP进行索引;了解OLAP查询处理的步骤。

  4.了解三类数据仓库应用;了解OLAM特别重要的原因。

  四. 数据立方体技术

  考试内容

  数据立方体计算概念 数据立方体计算方法 基于异常的、发现驱动的立方体空间探查

  考试要求

  1.理解数据立方体计算的概念;了解数据立方体计算的方法; 了解多路数组聚集方法、BUC、Star-Cubing方法的概念和步骤。

  2.理解预测立方体和多特征立方体的概念;了解基于异常的、发现驱动的立方体空间探查;理解三种异常指示符的概念。

 五.挖掘频繁模式、关联和相关性

  考试内容

  频繁项集概念  频繁项集挖掘方法  多层关联规则  多维关联规则 从关联规则到相关分析

  考试要求

  1.理解项集、闭项集、频繁项集和关联规则的概念 。

  2.了解Apriori算法的步骤;了解改进Apriori算法的一般思路;了解频繁项集挖掘的瓶颈;了解FP-growth算法的步骤和优缺点。

  3.理解多层关联规则的概念;了解挖掘多层关联规则的方法;理解多维关联规则、量化关联规则的概念;掌握相关性度量提升度(lift)的计算方法。

  六. 分类和预测

  考试内容

  数据分类和预测的概念 判定树归类算法 信息增益 增益率 基尼系数 树剪枝 贝叶斯定理  朴素贝叶斯分类  基于规则分类 回归分析 分类法的准确性 组合分类器 模型选择

  考试要求

  1.理解数据分类的概念;了解分类的两个过程;理解监督学习和非监督学习的区别;了解分类和预测的数据预处理方法;掌握评估分类和预测方法的标准。

  2.了解判定树的概念和典型算法(ID3和C4.5算法);掌握信息增益、增益率和基尼指数等三种属性选择度量的求法;理解两种常用的树剪枝方法。

  3.理解贝叶斯分类的概念;了解贝叶斯定理公式;了解朴素贝叶斯分类的;理解使用IF-THEN规则分类的方法;了解其他分类方法。

  4.理解预测与分类的区别;了解线性回归和非线性回归的模型。

  5.掌握评估分类器性能的度量;了解评估分类和预测准确率的方法;了解组合分类器的概念和常用的组合分类方法;了解ROC曲线的概念和特点。

  七. 聚类分析

  考试内容

  聚类分析的概念  数据类型 聚类方法的分类 算法方法的距离度量 划分方法 层次方法 基于密度的方法 基于网格的方法 基于模型的方法 孤立点分析

  考试要求

  1.理解聚类分析的概念;了解聚类分析的应用领域;了解比较聚类方法的标准;了解数据挖掘对聚类的典型要求。

  2. 了解聚类分析中的数据类型;掌握区间标度变量、二元变量、标称、序数和比例标度变量的求法。

  3.了解主要聚类方法的分类;了解算法方法的距离度量。

  4. 理解划分方法的概念;了解K-平均和K-中心点划分方法的算法;理解层次方法的概念;了解典型的层次聚类方法;了解典型的基于密度的聚类方法;了解典型的基于网格的聚类方法;了解典型的基于模型的聚类方法。

  5. 理解孤立点的概念;了解基于计算机的孤立点探测方法。

  第二部分:考试方法和考试时间

  数据挖掘考试采用闭卷、笔试形式,考试时间为180分钟

  第三部分:试卷结构

  (一)题分  试卷满分为150分 

  (二)题型比例

  选择题与判断题 约40%

  简答题和计算题  约60%


以上是聚创考研网为考生整理的"西南财经大学2018年817数据挖掘综合硕士研究生入学考试大纲"的相关考研信息,希望对大家考研备考有所帮助! 备考过程中如有疑问,也可以添加老师微信H17720740258进行咨询。

分享:
学习QQ群
MORE
浏览过该网页的还看了 MORE
聚创考研网校微信 聚创考研网校微信