基于大数据的统计方法课程旨在系统介绍基于大数据的统计学基本原理、思想和方法与上机实践。课程主要内容包括大数据的抽样分析、数据的预处理、探索性数据分析、机器学习、数据的展示、时空数据分析等内容。其中机器学习方法有逻辑回归、判别分析、朴素贝叶斯、惩罚回归、K近邻法、随机森林、提升法、支持向量机、人工神经网络、主成分分析、聚类分析等。通过本课程的学习使学生能够掌握大数据分析的统计学基本原理、思想和方法。着重培养学生面对实际数据时,提出问题和解决问题的基本能力,特别是能够使用某种计算机语言分析数据和解释分析结果的能力,为社会培养具有社会主义核心价值观的应用型、复合型和创新型的数字经济专门人才。
课程目标:
课程目标1:使学生能够在一个较短的时间内全面、系统地了解基于大数据的统计方法的基本概念与基本内容,掌握大数据的抽样分析、数据的预处理、探索性数据分析、机器学习、数据的展示、时空数据分析等,为学生成功地走上数字经济工作岗位打下良好的基础。
课程目标2:以体验式的互动学习方式,通过实操具备提出问题和解决问题的基本能力,特别是能够使用某种计算机语言分析数据和解释分析结果的能力,实现由以教师为主到以学生为主的改变。锻炼学生面对实际数据时的判断能力、解决问题能力,提升学生的创新思维能力和解决实际问题能力,同时提高学生的团队合作能力。
课程目标 3:形成正确的基于大数据的统计创新思维;正确理解大数据统计分析方法对于现代统计分析带来的影响;塑造基于大数据统计的创新意识和创造精神,培养具有社会主义核心价值观的应用型、复合型和创新型的数字经济专门人才。