kaggle实战-销售数据的精美可视化分析与时序预测
本文是基于一份商品销售数据,使用Pandas、seaborn、statmodels、sklearn、线性回归预测、xgboost
等库和方法进行多角度的可视化分析和时序预测。
Stay Foolish Stay Hungry
本文是基于一份商品销售数据,使用Pandas、seaborn、statmodels、sklearn、线性回归预测、xgboost
等库和方法进行多角度的可视化分析和时序预测。
最近获取到了一份IC电子产品电商数据的分析,后面会进行3个主题的数据分析:
本文是第一个阶段,主要内容包含:
决定模型好坏的一个重要工作就是:特征工程
机器学习在本质还是特征,数据和特征决定了机器学习的上限,模型和算法知识逼近这个上限而已。
特征工程介于数据和算法之间,常见的特征工程分为:
本文讲解的是一个Python的进阶知识点:**如何将一个嵌套的大列表展开形成一个大列表。**提供了7种方法供大家学习参考:
机器学习有许多不同的算法,每个算法都有其特定的应用场景和优缺点。然而,最简单的机器学习算法可能是线性回归。
线性回归是一种用于预测连续数值输出的监督学习算法,它通过建立一个线性方程来描述输入变量与输出变量之间的关系。该算法的目标是使预测值与真实值之间的差异最小化。
线性回归通常用于解决简单的预测问题,例如根据房屋面积和其他特征来预测房屋价格,或根据历史销售数据来预测未来销售量。它是许多其他机器学习算法的基础,因此是深入学习机器学习的重要一步。
更新《机器学习算法竞赛实战》一书的阅读笔记,更多详细的内容请阅读原书。本文的主要内容包含: