内容简介
全书共九章,内容包括大数据概述、聚类分析、判别分析、主成分分析、因子分析、线性模型、回归诊断、有偏估计、变量选择。各章都有丰富的案例分析,为加深读者对每章内容的理解,将每章的练习分为理论和实证部分,书后附有参考答案,为使书中案例贴近数据的应用实际,采用了获取方便的证券市场高频数据,并使用国际通用的R软件进行数据收集、处理、加工和分析,便于读者自己动手和实际应用需要。全书内容讲解简明扼要,注重应用,让读者从收集数据开始,掌握数据收集、整理和大数据统计分析的全过程。
《金融大数据统计方法与实证》可作为统计学、经济学、管理科学、计算机科学等相关专业本科生的教材和教学参考书,也可作为相关专业硕士生的教材和案例分析参考书,书中大部分内容也可供大数据分析应用的大学生、研究生、教师、科研人员和统计工作者参考。
内页插图
目录
前言
第1章 大数据概述
一、大数据的数字特征
二、大数据的图表示
练习1
第2章 聚类分析
一、相似性度量
二、系统聚类法
三、变量聚类法
四、动态聚类法
练习2
第3章 判别分析
一、距离判别
二、费歇判别
三、贝叶斯判别
练习3
第4章 主成分分析
一、基本思想
二、样本主成分
三、特征值因子的筛选
四、主成分分类
练习4
第5章 因子分析
一、因子分析模型
二、因子旋转
三、因子得分
练习5
第6章 线性模型
一、线性模型及参数的最小二乘估计
二、最小二乘估计的性质
三、线性模型的显著性检验
四、正回归
练习6
第7章 回归诊断
一、残差
二、残差图
三、异常点
练习7
第8章 有偏估计
一、均匀压缩估计
二、主成分估计
三、岭估计
练习8
第9章 变量选择
一、变量选择准则
二、逐步回归
三、绝对约束估计
四、弹性约束估计
五、非负约束估计
练习9
练习提示与参考答案
参考文献
附录R 应用程序
前言/序言
1952年,芝加哥大学的马科维兹(Markowitz)首次采用股票收益率历史数据的方差,作为风险衡量指标,并指出与证券市场的整体运行相关联的宏观系统风险不能通过投资分散化加以消除,称为不可分散风险。马科维兹在投资者效用的基础上,将复杂的投资决策问题简化为一个风险(方差)-收益(均值)的二维问题,即在相同的期望收益条件下,投资者选择投资风险最小的证券(组合),或在相同的投资风险下,选择预期收益率证券(组合)。开统计方法应用于金融市场之先河。1978年,西蒙斯(Simons)开发了许多数学模型用来进行分析和交易,这些基本上是自动完成。他用计算机编程建立模型分析股票价格,从而能进行很轻松的交易并获利。这些模型是建立在海量的数据基础上的,所以具有可靠性并可进行实际预测,1989~2009年,他操盘的大奖章基金平均年回报率高达35%,较同期标普500指数年均回报率高20多个百分点,比金融大鳄索罗斯和股神巴菲特的操盘表现都高出10余个百分点。即便是在次贷危机爆发的2007年,该基金的回报率仍高达85%。西蒙斯成就了世界上最伟大的对冲基金之一:大奖章基金。大数据的历史相对较晚一些。2008年年末,大数据才得到部分美国知名计算机科学研究人员的认可,但在2013年,大数据就已经风靡全球,成为一个时代的符号。我们早在2002年开始从事金融数据挖掘研究和教学,2011年正式给本科生开设证券数据统计建模与实证分析课程,2013年结合大数据发展,给硕士生和博士生开设了金融大数据统计方法与实证的课程。
金融大数据统计方法与实证 下载 mobi epub pdf txt 电子书 格式