关于科学数据处理的统计学习教程

优质
小牛编辑
137浏览
2023-12-01

Statistical learning

Machine learning is a technique with a growing importance, as the size of the datasets experimental sciences are facing is rapidly growing. Problems it tackles range from building a prediction function linking different observations, to classifying observations, or learning the structure in an unlabeled dataset.

This tutorial will explore statistical learning, the use of machine learning techniques with the goal of statistical inference: drawing conclusions on the data at hand.

Scikit-learn is a Python module integrating classic machine learning algorithms in the tightly-knit world of scientific Python packages (NumPy, SciPy, matplotlib).

  • 机器学习: scikit-learn 中的设置以及预估对象
    • 数据集
    • 预估对象
  • 监督学习:从高维观察预测输出变量
    • 最近邻和维度惩罚
    • 线性模型:从回归到稀疏
    • 支持向量积(SVMs)
  • 模型选择:选择估计量及其参数
    • 分数和交叉验证分数
    • 交叉验证生成器
    • 网格搜索和交叉验证估计量
  • 无监督学习: 寻求数据表示
    • 聚类: 对样本数据进行分组
    • 分解: 将一个信号转换成多个成份并且加载
  • 把它们放在一起
    • 模型管道化
    • 用特征面进行人脸识别
    • 开放性问题: 股票市场结构
  • 寻求帮助
    • 项目邮件列表
    • 机器学习从业者的 Q&A 社区