xxdd123321

导航

 

kaggle案例 (介绍)

机器学习算法、工具与流程概述

  • 机器学习应用领域

    • 经济

    • 能源

    • NLP

    • 互联网用户行为

    • 销量预测

    • 深度学习应用

    • 推荐系统相关

    • 其他预测

  • 机器学习常用算法

    目前没有提到强化学习,主要应用机器人领域

     Unsupervised(无监督学习-一般用于辅助)Supervised(监督学习 常用)
    Continuous(连续) Clustering & Dimensionality Reduction Regression
      SVD Linear
      PCA Polynomial
      K-means Decision Trees 决策树
        Random Forests
    Categorical(分类) Association Analysis Classification
      Apriori KNN(少用)
      FP-Growth Trees
      Hidden Markov Model Logistic Regression
        Naive-Bayes(朴素贝叶斯 简单粗暴)
        SVM
  • 常用工具

    scikit-learn常用

    gensim自然语言处理

    Natural Language Toolkit英文自然语言处理

    pandas数据预处理 数据清洗 产出特征

    深度学习

    Caffe图像用的比较多

    Keras接口非常简单,会用到

  • 建模与问题解决流程

    1. 数据处理 (清洗,调权)

    2. 特征工程

    3. 模型选择

    4. 寻找最佳超参数:交叉验证

    5. 模型分析与模型融合

posted on 2022-08-06 15:50  xxdd123321  阅读(22)  评论(0)    收藏  举报