数据挖掘方法及其在上市公司中的应用研究
详细信息    本馆镜像全文|  推荐本文 |  |   获取CNKI官网全文
摘要
随着全球经济的迅猛发展,知识的占有逐渐成为市场经济主体成功角逐市场的关键,然而这种知识绝然不同于平常意义上的知识,它必须具有开创性和可靠性两个基本特征,开创性是指知识是新发现的,可靠性是指知识能积极辅助判断和决策的品质。
     针对知识的获取,本文利用上市公司披露信息数据库为平台,系统地研究了数据挖掘中的关联规则挖掘和神经网络方法,建设性地运用数据挖掘方法去获取基于上市公司的知识,克服了国内以往数据挖掘研究“极大忠诚于外国文献”、重理论轻实践的缺点,生动、形象地展现了基于关联规则挖掘和神经网络方法的知识发现过程。
     在实证研究中,通过挖掘出的有趣规则——“上市公司被处罚→上市公司被特别处理”,我们获得知识——“如果某上市公司被处罚,那么该上市公司未来有80%的可能性会出现财务危机”。这为投资者和监管部门的决策提供了有用信息。通过对把神经网络方法应用于财务风险识别的研究,我们不仅把模型的仿真度提高到100%,而且显著提高了财务状况特征识别准确率。这将为神经网络模型运用于社会科学领域提供了切实可行的经验。
     理论上而言,研究不仅把数据挖掘和上市公司的知识发现联系在了一起,而且,前所未有地,就数据挖掘在上市公司知识发现中的运用做了比较系统的阐述,抛砖引玉地把上市公司相关信息的数据挖掘工作呈现在人们面前,开拓出了一个广阔的实证分析领域。
With rapid development of global economy, occupying knowledge gradually become the key to succeed in market competetion for market economy subjects. Otherwise, this kind of knowledge is significantly different from the ususl knowledge by two features of it-"initiativeness and reliability".The initiativeness means that it is the first time that it is discoveried,and the reliability mean to its ability to help positively people make discriminant and decision.
    For that, this thesis, based on the database that contain the information issued by listed A share companies, not only systematically make research of Association Rules Mining and Neural Network Prediction Method in Data Mining,but also acquire some knowledge about listed A shares companies by constructive use of these two Datamining tools. Overcoming the drawback of "greatly loyal in foreign documents"and empirical analysis lackness tagged to Datamining research in China,this paper vividly represent Knowledge Discovery process through empirical research of Association Rules Mining and Neural Network Method.
    The finding through Association Rules Mining shows knowledge that the probability is 80% of that one listed company will present financial crisis in the future if this listed company has been forfeited. Obviously ,it transmit some valuable information to not only investors but also the government supervisors. Not merely this, the empirical study on Neural Network indicate that the company financial situation detection model based on Neural Network not only bring the fidelity up to 100%,but also significantly highten the accuracy ratio of detection. It is no doubt that the finding offer feasible experience to help people apply the Neural Network into detecting objective subject in social science field.
    In theory, the thesis cast the problem How to discovery in Database of listed companies to attract more and more people study on it ,then open up a wide empirical analysis field, while firstly make systematical research on Datamining application into Knowledge Discovery in listed companies.
引文
[1] 佚名.AICPA发布2004年影响会计行业10大信息技术.www.cpa-view.com,2004-03-05
    [2] 中国人民大学统计学系数据挖掘中心.统计学与数据挖掘,统计与信息论坛,2002,17(1):4-9
    [3] Rasmussen J. The Role of Hierarchical Knowledge Representation in Decision Making and Systems Sanagement. IEEE Transactions on Systems, Man, and Cybernetics, 1985,15(2):234-243
    [4] 李子奈,叶阿忠.高等计量经济学.第1版.北京:清华大学出版社,2000
    [5] 熊熊,张维.数据挖掘技术及其实现.预测,2001,(4):64-68
    [6] 中国人民大学统计学系数据挖掘中心.数据挖掘中的决策树技术及其应用.统计与信息论坛,2002,17(2):4-10
    [7] 中国人民大学统计学系数据挖掘中心.数据挖掘中的聚类分析.统计与信息论坛,2002,17(3):4—9
    [8] 中国人民大学统计学系数据挖掘中心.建立数据挖掘为基础的客户关系管理体系.统计与信息论坛,2002,17(4):4—9
    [9] 中国人民大学统计学系数据挖掘中心.关联规则挖掘概述.统计与信息论坛,2002,17(5):4—9
    [10] 中国人民大学统计学系数据挖掘中心.数据挖掘在信用卡公司的应用.统计与信息论坛,2002,17(6):4—9
    [11] 戴稳胜,匡宏波,谢邦昌.数据挖掘中的关联规则.统计研究,2002.(8):40-42
    [12] 朱世武,崔嵬,张尧庭等.数据挖掘与其他技术的比较.统计研究,2003,(7):58-60
    [13] 朱世武,崔嵬,张尧庭等.数据挖掘运用的理论与技术.统计研究,2003,(8):45-50
    [14] 刘同明.数据挖掘技术及其应用.第1版.北京:国防工业出版社,2001
    [15] Gregory Piatetsky-Shapiro. The Data-Mining Industry Coming of Age. IEEE Intelligent Systems. 1999,14(6):32-34
    [16] Sam Y. Sung, Zhao Li, Chew L. Tan, et al..Forecasting Association Rules Using Existing Data Sets. IEEE Transactions on Knowledge and Data Engineering, 2003,15(6): 1448-1459
    
    
    [17] 朱绍文,王泉德,黄浩等.关联规则挖掘技术及发展方向.计算机工程,2000,26(9):4-6
    [18] 铁治欣,陈奇,俞瑞钊.关联规则采掘综述.计算机应用研究,2000,1:1-5
    [19] 丁夷.关联规则在电信市场研究中的应用.西安邮电学院学报,2000,5(3):39-41
    [20] 倪志伟,蔡庆生,方瑾.用神经网络来挖掘数据库中的关联规则.系统仿真学报,2000,12(6):685-687
    [21] 苏超,左万利.基于关联规则的分类.吉林大学自然科学学报,2001,1:31-35
    [22] 王翔,袁兆山.关联规则的扩展模型.小型微型计算机系统,2001,22(1):73-74
    [23] 娄兰芳,蒋志方,王乐强.数据挖掘中关联规则的有趣性研究.研究与开发,2002,10:10-13
    [24] 石阳,张红云,马垣.数据挖掘中关联规则算法及其应用.鞍山师范学院学报,2002,4(1):79-81
    [25] 杨学兵.一种高效的多维关联规则挖掘算法研究.微机发展,2002,6:52-54
    [26] 何炎祥,张戈,石莉.关联规则维护.计算机工程与应用,2002,10:203-205
    [27] 白秀玲,崔林,王向阳等.关系数据库中关联规则的挖掘.电脑开发与应用,2002,15(10):5-6
    [28] 张智军,方颖,许云涛.基于Apriori算法的水平加权关联规则挖掘.计算机工程与应用,2003,14:197-199
    [29] 罗可,吴杰.关联规则衡量标准的研究.控制与决策,2003,18(3):277-280
    [30] 李乃乾,沈钧毅,田絮资.一种新的普遍化关联规则挖掘算法.计算机工程,2003,29(7):4-6
    [31] 袁玉波,程君华.数据挖掘中的负关联规则算法.西北民族大学学报,2003,24(3):7-11
    [32] Agrawal R, Imiedlinski T, Swami A. Mining Association Rules Between Sets of Items in Large Database. In: Proc of ACM SIGMOID Conf on Management of Data. Washington, 1993, 207-216
    [33] R.Agrawal, T.Imielinski, A.Swami. Database lVfining: A Performance Perspctive. IEEE Transactions on Knowledge and Data Engineering, 1993,5(6):914-925
    [34] Edward R. Omiecinski. Alternative Interest Measures for Mining Associations in Databases. IEEE Transactions on Knowledge and Data Engineering,
    
    2003,15(1):57-69
    [35] R·格罗思.数据挖掘:构筑企业竞争优势.侯迪,宋擒豹.第1版.西安:西安交通大学出版社,2001
    [36] Jiawei Han,Micheline Kamber.数据挖掘:概念与技术.范明,孟小峰.第1版.北京:机械工业出版社,2001
    [37] Chang-Hung Lee, Ming-Syan Chen, Cheng-Ru Lin. Progressive Partition Miner: An Efficient Algorithm for Mining General Temporal Association Rules. IEEE Transactions on Knowledge and Data Engineering,2003,15( 4): 1004-1017
    [38] Anthony K.H. Tung, Hongjun Lu, Jiawei Han,et al.Efficient Mining of Intertran-saction Association Rules. IEEE Transactions on Knowledge and Data Engineering, 2003,15(1):43-56
    [39] Ke Wang, Yu He, Jiawei Han Ke Wang, ea tl.Pushing Support Constraints Into Association Rules Mining. IEEE Transactions on Knowledge and Data Engineering, 2003,15(3):642-658
    [40] Vassilios S. Verykios, Ahrned K. Elmagarmid, Elisa Bertino, et al. Association Rule Hiding. IEEE Transactions on Knowledge and Data Engineering, 2004,16(4): 434-447
    [41] 赵宏,邹雯,汪洁.证券市场预测的神经网络方法.系统工程理论与实践,1997,6:127-130
    [42] 张晓红.神经网络经济预测法研究.预测,2001,20(6):61-63
    [43] 王今,韩文秀,侯岚.西方企业财务危机预测方法评析.中国软科学,2002,6:109-112
    [44] 李宗伟,王美娟,郑淑华.基于径向基神经网络的股价预测.上海理工大学学报,2002,24(1):81-82
    [45] 伍海华,马嫒,高波;RBF神经网络在上市公司综合评价中的应用.青岛大学学报,2002,17(2):1-3
    [46] 鲍祖尚,蔡兆云.神经网络理论在股市建模中的应用.湖南工程学院学报,2002,12(2):51-53
    [47] 朱赞,王行愚.RBF神经网络在股市趋势预测中的应用.华东理工大学学报,2002,28(5):547-550
    [48] 周毓萍.基于神经网络的不良资产价值评估.统计与决策,2003,9:30-31
    [49] 尹恕好.神经网络实证方法对我国资本市场有效性及非线性的检验.深圳证券交易所第六届会员单位、基金公司研究成果评选.2003
    
    
    [50] 黄德镛,叶家冕,戴晓红等.有色金属类上市公司财务评价的自组织随机模型.昆明理工大学学报,2003,28(5):147-150
    [51] 曹顺,刘婷,基于BP神经网络的企业信用评价研究.控制工程,2003,10(5):404-406
    [52] 荣莉莉,王众托.基于知识和模糊神经网络的学习型评价系统.管理科学学报,2003,6(3):1-7
    [53] 李佳斌,王伟.人工神经网络在企业风险评估中的应用.技术经济与管理研究,2003,3:50-51
    [54] 岳鹏.高技术项目投资风险评价的人工神经网络模型研究.西安财经学院学报,2003,16(4):19-22
    [55] 龚哲君,肖文韬.证券投资组合问题的人工神经网络求解.武汉化工学院学报,2003,25(1):90-92
    [56] 胡守仁,余少波,戴葵.神经网络导论.第1版.长沙:国防科技大学出版社,1993,35-42
    [57] 高隽.人工神经网络原理及仿真实例.第1版.北京:机械工业出版社.2003,44-55
    [58] Hongjun Lu, Rudy Setiono, Huan Liu. Effective Data Mining Using Neural Network. IEEE Transactions Knowledge and Data Engineering, 1996, 8(6):957-961
    [59] K.Betels, J.M.Jaeques, L.Neuberg, etal. Qualitative company performance evaluation :Linear discriminant analysis and neural network models. European Journal of Operational Research, 1999, 115(3):608-615
    [60] Benzing, Cythia. Using Discriminant Analysis to Predict Financial Distress. International Advances in Economic Research, 2000, (6):591-593
    [61] Gouqiang Zhang, Michael Y. Hu, B. Eddy Patuwo, etal. Artificial Neural Network in Bankruptcy Prediction: General Framework and Cross-validation Analysis. European Joumal of Operational Research, 1999, 116(1): 16-32
    [62] Pamela K.Coats, L.Franldin Fant. Recognizing Financial Distress Patterns Using a Neural Network Tool. Financial Management, 1993, (11):142-155
    [63] 飞思科技产品研发中心.MATLAB6.5辅助神经网络分析与设计.第1版.北京:电子工业出版社,2003
    [64] 卢文岱.SPSS for Windows统计分析.第2版.北京:电子工业出版社,2002
    [65] 黎自任.经济多元分析.第1版.北京:中国统计出版社,1995