Fork me on GitHub
尤尔小屋

Stay Foolish Stay Hungry


  • Home

  • Tags

  • Categories

  • Archives

  • About

  • links

kaggle实战-精美可视化与时序预测

Posted on 2023-3-15 | In Machine learning , kaggle |
Words count in article: 6.3k | Reading time ≈ 35

kaggle实战-销售数据的精美可视化分析与时序预测

本文是基于一份商品销售数据,使用Pandas、seaborn、statmodels、sklearn、线性回归预测、xgboost等库和方法进行多角度的可视化分析和时序预测。

Read more »

基于机器学习的IC电商数据挖掘-数据探索篇

Posted on 2023-3-15 | In python , 实战 |
Words count in article: 2.3k | Reading time ≈ 12

基于机器学习的IC电子产品数据挖掘

最近获取到了一份IC电子产品电商数据的分析,后面会进行3个主题的数据分析:

  1. 第一阶段:基于pandas、numpy、matplotlib、plotly等库的统计可视化分析
  2. 第二阶段:基于机器学习聚类算法和RFM模型的用户画像分析
  3. 第三阶段:基于关联规则算法的品牌、产品和产品种类关联性挖掘

本文是第一个阶段,主要内容包含:

  • 数据预处理
  • 数据探索EDA
  • 多角度对比分析

Read more »

python巧妙实现阶乘n!

Posted on 2023-3-15 | In python , 进阶 |
Words count in article: 979 | Reading time ≈ 4

python实现阶乘

本文给大家介绍如何使用python和第三方库来实现数学运算中的阶乘以及阶乘累计求和。

Read more »

机器学习算法竞赛实战-特征工程

Posted on 2023-3-1 | In Machine learning , kaggle |
Words count in article: 3.4k | Reading time ≈ 13

机器学习算法竞赛实战:特征工程

决定模型好坏的一个重要工作就是:特征工程

机器学习在本质还是特征,数据和特征决定了机器学习的上限,模型和算法知识逼近这个上限而已。

特征工程介于数据和算法之间,常见的特征工程分为:

  • 数据预处理
  • 特征转换
  • 特征提取
  • 特征选择

Read more »

python进阶-嵌套列表展开

Posted on 2023-3-1 | In python , 进阶 |
Words count in article: 658 | Reading time ≈ 2

本文讲解的是一个Python的进阶知识点:**如何将一个嵌套的大列表展开形成一个大列表。**提供了7种方法供大家学习参考:

  • for循环
  • 列表推导式
  • 使用第三方库itertools
  • 使用sum函数
  • python自加(+=)
  • 使用extend函数
  • 使用递归函数

Read more »

机器学习算法竞赛实战-数据探索EDA

Posted on 2023-2-28 | In Machine learning , kaggle |
Words count in article: 2k | Reading time ≈ 8

机器学习算法竞赛实战-数据探索

本文是《机器学习算法竞赛实战》的读书笔记2:在进行建模之前如何进行数据探索,了解数据的基本情况。通过系统的探索加深对数据的理解。

Read more »

鱼书笔记4-基于计数和推理方法的比较

Posted on 2023-2-28 | In NLP , 鱼书 |
Words count in article: 3k | Reading time ≈ 14

对比计数统计和推理两种方法

本文记录的是书籍《深度学习进阶:自然语言处理》的第四章学习笔记。

Read more »

机器学习从0入门-线性回归

Posted on 2023-2-23 | In Machine learning , 教程 |
Words count in article: 3.5k | Reading time ≈ 12

小白学机器学习1:线性回归

机器学习有许多不同的算法,每个算法都有其特定的应用场景和优缺点。然而,最简单的机器学习算法可能是线性回归。

线性回归是一种用于预测连续数值输出的监督学习算法,它通过建立一个线性方程来描述输入变量与输出变量之间的关系。该算法的目标是使预测值与真实值之间的差异最小化。

线性回归通常用于解决简单的预测问题,例如根据房屋面积和其他特征来预测房屋价格,或根据历史销售数据来预测未来销售量。它是许多其他机器学习算法的基础,因此是深入学习机器学习的重要一步。

Read more »

机器学习算法竞赛实战-竞赛问题建模

Posted on 2023-2-21 | In Machine learning , kaggle |
Words count in article: 1.1k | Reading time ≈ 4

机器学习算法竞赛实战-竞赛问题建模

更新《机器学习算法竞赛实战》一书的阅读笔记,更多详细的内容请阅读原书。本文的主要内容包含:

  • 竞赛问题的3个主要部分
  • -如何理解竞赛问题
  • 机器学习的样本选择
  • 如何线下评估模型
  • 实战案例

Read more »

NLP学习3-基于计数方法的改进

Posted on 2023-1-28 | In NLP , 鱼书 |
Words count in article: 2.1k | Reading time ≈ 9

基于计数方法的改进

本文记录的是鱼书第3章:如何对原有的计数方法进行改进。

Read more »
12…83下一页
PiQianChao

PiQianChao

My Blog

821 posts
106 categories
156 tags
RSS
GitHub E-Mail

标签云

  • CNN1
  • CSV1
  • CV1
  • EDA1
  • Hadoop14
  • Hive13
  • JJ12
  • Jieba1
  • KDE1
  • Kats1
  • LaTex2
  • LeetCode16
  • MSE1
  • MySQL67
  • NLP12
  • NN1
  • PCA2
  • SVM2
  • TensorFlow17
  • Tool19
  • d38
  • dash6
  • git1
  • go42
  • group1
  • highcharts12
  • json3
  • jupyter5
  • kaggle26
  • keras11
  • linux14
  • markdown1
  • matplotlib1
  • numpy15
  • pandas151
  • plotly15
  • px35
  • pyecharts17
  • pyg2plot1
  • python100
  • seaborn3
  • shap1
  • sklearn3
  • spark19
  • spider9
  • sql3
  • sqlzoo18
  • tableau3
  • uci1
  • 二分类3
  • 互联网38
  • 产品1
  • 优化器2
  • 公众号1
  • 关联分析2
  • 写作9
  • 分类4
  • 列表1
  • 区域链14
  • 卷积2
  • 卷积神经网络1
  • 召回率2
  • 可视化125
  • 可解释性1
  • 吴恩达18
  • 回归5
  • 回归分析3
  • 图像处理1
  • 基金2
  • 大数据48
  • 天池1
  • 字典1
  • 容器1
  • 导数1
  • 岭回归1
  • 工具2
  • 建模1
  • 开源1
  • 异常检测2
  • 张量1
  • 归一化1
  • 循环1
  • 感受野1
  • 成长13
  • 投资2
  • 抽样1
  • 推荐系统2
  • 支持向量机1
  • 数学2
  • 数据分析92
  • 数据处理2
  • 数据库104
  • 数据挖掘8
  • 数据探索1
  • 数据结构11
  • 文本处理4
  • 旅游2
  • 无监督1
  • 无监督学习2
  • 时序分析1
  • 时间序列10
  • 机器学习145
  • 李沐1
  • 树模型1
  • 梯度1
  • 梯度下降2
  • 欠采样1
  • 正则化1
  • 池化1
  • 深圳12
  • 深度学习44
  • 深漂22
  • 激活函数2
  • 爬虫5
  • 牛客1
  • 特征工程9
  • 特征编码1
  • 独热码1
  • 生活50
  • 电商1
  • 电影6
  • 监督学习4
  • 相关性1
  • 相关系数1
  • 矩阵运算1
  • 神经元1
  • 神经网络8
  • 离散化1
  • 积分1
  • 窗口函数1
  • 竞赛2
  • 算法16
  • 精度1
  • 索引1
  • 线性回归1
  • 经济8
  • 统计5
  • 编码2
  • 编程1
  • 网络1
  • 美食16
  • 聚类3
  • 自动化1
  • 自我管理8
  • 自然语言处理1
  • 计算机4
  • 词云图1
  • 运营1
  • 递归1
  • 逻辑回归4
  • 阅读28
  • 降维3
  • 随机森林5
  • 隐藏层1
  • 集成学习5
  • 青春1
© 2023 PiQianChao
Powered by Hexo
|
Theme — NexT.Muse v5.1.4
博客全站共1251.7k字