数据挖掘方法在股票分析中的应用文献综述

 2022-08-09 15:32:54

决策树及神经网络算法在股票分类预测中的应用

摘要:股票投资素来以高风险、高收益为特点,作为证券行业的重要组成部分,反映着市场经济的总体情况。近年来,随着人们生活水平的提高,越来越多的投资者入市投资以期从中获取可观的收益。然而,股票市场是一个非常复杂的系统,受众多可量化、不可量化的因素影响,每天会产生海量的、繁琐的数据。这对一般的投资者来说很难从中提取有价值的信息,并作出有效的投资决策。人们也希望能有一种科学有效的方法对股票进行评估,能够判断未来相关指标的变化趋势,从而提高投资收益率、降低投资风险。

数据挖掘方法作为一种从大量数据中挖掘其隐藏信息的手段,近年来,越来越多的研究者开始进行相关的实验研究。从国内外研究现状来看,主要研究集中在两个方面:第一使用网络上的舆情分析对未来股票做出预测;第二就是基于股票价格序列本身,或者其衍生的技术指标对股票价格进行建模,从而做出预测。

这些研究在特定的一些难题上取到了一定的成果,充分证明了将算法应用于历史数据,建立可靠的分类预测模型这个研究方向具有可行性和现实性。但是基于股票市场的实时性和复杂性,我们还要进一步加深相关研究的深度,并不断探索新的研究方向,从中挖掘出隐藏的内在价值和规律。

关键词:数据挖掘; 股票分类; 技术指标;分类模型

一、文献综述

文献[1]采用时态神经网络对股票进行分类预测。其针对的数据是时态数据,即带有时间属性的数据。一般而言我们获取的实时数据包括时间、股票名称和代码、股票开盘价、最高最低价、收盘价、成交量等。该文献适时引入时态数据,一方面充分利用了大量的原始数据,另一方面经过相关的转化降低了数据的维度和复杂性,有利于提高后期模型的准确性和可靠性。这对指标选择、数据预处理阶段提供了借鉴经验。文献[2]介绍了股票市场中常用的技术指标,对本论文有很大的参考价值;还指出了这些指标存在后验性、片面性、复杂性、欺骗性、技术性,这有助于补充金融相关的知识。文献[3]较为详细的介绍了神经网络和具体的案例。了解算法的数学推导和应用算法时的相关参数的设置是十分必要的,有助于在针对不同的个案时,能正确设定参数,从而建立可靠的模型。人工神经网络是理论化的人脑神经网络的数学模型,是基于模仿电脑神经网络结构和功能而建立的一种信息处理系统。因为它具有高度的并行性、高度的非线性全局作用、良好的容错性与联想记忆功能和十分强大的自适应、自学习能力,而且可逼近任何连续函数,在多变量非线性系统的建模方面取得了惊人的成就,是预测股票的一种有效的方法。文献[5]和文献[6]则是分别介绍了用Python和Matlab和对应工具进行数据挖掘方面的实验,还详细介绍了其中的库、工具包以及具体的使用方法,这对编程开发提供了很多可以学习的案例。文献[8]、文献[9]、文献[10]很好的展示了国内外数据挖掘的方法在股票分析中的应用,对比发现国外学者的研究内容主要针对海外的股票市场,很多案例集中于具体的实施算法的优化方面,针对个体投资者的可用解决方案研究较少。与国外相比而言,国内股市研究方面相对落后,但是随着我国股市的日完善,专家学者对股票市场的研究日益增多,相关的实验案例也取得了一些令人满意的结果。文献[11]介绍了利用分析国际新闻杂志对股票趋势的影响,是属于舆情分析方面的研究,主要提取新闻中的大众心态、行内发展趋势、政策风向等信息,需要对这些信息进行量化评估。这对本文进行的实验虽然没有直接的帮助,但是这个案例中数据挖掘方法的应用,尤其是数据收集、文本处理方面有很大的参考价值。

这些文献中有不少精彩的案例和独特的创新点。如文献[1]在数据收集和数据处理方面做的较好。该文献主要收集了时态数据,并假设这些对象为初始维状态集合,即,这些属性大多都是独立的属性集,其紧接着对时态因子下的属性集进行转换计算,引入时态因子,达到新的维状态集合,即,这些新的属性一览与该时态因子外的其他时态因子,能更好的反映数据的时态特征。然后选定嵌入模型,根据嵌入模式确定嵌入维数。该文献最终需要选定1000条数据进行导入,最后将需要的初始数据储存到数据库中,将相邻的个数据之间连续连接形成云元数据集,将获得的元数据集传入时态数据转换机中,经过相关公计算,得到时态神经网络的模型后一部分的输入数据。总而言之,数据处理最终的目的是为了输入变量的规范化,每一个模型本身都会对输入数据有要求。从这个角度出发,时态转化也是一种数据处理的手段,其数学推导较为复杂,对于初学者和普通投资者来说,时态数据的确是相对容易获取的,但是经过变化后,数据变得更为抽象。结合本论文即将进行的实验,数据处理阶段也是一个极为重要的环节,数据转化的质量直接关系到了分类结果的优劣。文献【1】提供了一个非常好的处理思路:可以不仅仅局限于原始数据指标,经过相关的转化,可以抽象出其他维度的指标,这样可以更加契合模型的特点。

文献[2]中介绍的相关的股市技术指标,从数学推导、金融背景这两个角度做了较为详细的介绍。如MA,即移动平均线。移动平均线是由美国的投资专家Joseph E.Granville提出的,均线理论也是当今应用得最普遍的技术指标之一。简单来说,它可以帮助交易者确认现有趋势,并且判断将会出现的趋势。其计算方法为:记-目标价格序列,-计算简单移动平均的周期,则有:

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。