数据分析 | IT懒猫 - 技术成就梦想

catroom

catroom

学习给人智慧，对真理而言，信服比流言更危险。

python数据分析--一元线性回归

测试数据这里分析1992年到200年国内生产总值x和财政收入y的数据分析代码： #!/usr/bin/env python # -*- coding: utf-8 -*- import pandas as pd from sklearn import linear_model import matplotlib.pyplot as plt data = pd.read_excel('F...

博客 2023-05-10 412 标签: 数据分析 python

阅读详细

数据分析--异常值处理

在数据分析中，我们会在数据中会发现一些异常值，他们的值很大或者很小，很不正常，会影响我们对数据的分析这里是对变量-降水量和变量-pm2.5的值做的散点图分析，但是可以看到有一个点在1000000附近，根据生活常识来说，这显然是不正常的。没有这么高的降水量，而且它是一个孤立的点。说明它是一个异常值。异常值的产生，有多种原因，可能是设备的问题。也可能是传感器的问题。这里不做讨论。一般我们对异常值的...

博客 2023-05-10 232 标签: 数据分析

阅读详细

python数据分析--matplotlib绘图和数据可视化工具包

Matplotlib是一个强大的Python绘图和数据可视化的工具包。数据可视化也是我们数据分析的最重要的工作之一，可以帮助我们完成很多操作，例如：找出异常值、必要的一些数据转换等。完成数据分析的最终结果也许就是做一个可交互的数据可视化安装方式：pip install matplotlib 引用方法：import matplotlib.pyplot as plt plot函数（绘制折线图） x ...

博客 2023-05-10 306 标签: python 数据分析

阅读详细

hadoop mapreduce计算实例

hadoop中使用mapreduce计算框架进行计算任务，场景：统计日志文件data02.log的数据中一共包含多少部电影。 Mapreduce代码实例 //Mapper过程 package sss; import java.io.IOException; import org.apache.hadoop.io.LongWritable; import org.apache.hadoop.io...

脚本代码 2023-04-27 302 标签: 数据分析 大数据 hadoop

阅读详细

数据分析问题总结

如何理解过拟合？过拟合和欠拟合一样，都是数据挖掘的基本概念。过拟合指的就是数据训练得太好，在实际的测试环境中可能会产生错误，所以适当的剪枝对数据挖掘算法来说也是很重要的。欠拟合则是指机器学习得不充分，数据样本太少，不足以让机器形成自我认知。为什么说朴素贝叶斯是“朴素”的？朴素贝叶斯是一种简单但极为强大的预测建模算法。之所以称为朴素贝叶斯，是因为它假设每个输入变量是独立的。这是一个强硬的假设...

博客 2023-03-22 214 标签: 数据分析

阅读详细

python数据分析之 Pandas数据分析库工具使用

数据分析之Pandas介绍 Pandas是一个开源的Python数据分析库。Pandas把结构化数据分为了三类： Series，1维序列，可视作为没有column名的、只有一个column的DataFrame； DataFrame，同Spark SQL中的DataFrame一样，其概念来自于R语言，为多column并schema化的2维结构化数据，可视作为Series的容器（container）...

脚本代码 2023-03-22 336 标签: python 数据分析

阅读详细

python数据分析之 NumPy基础:数组与向量化计算

NumPy ndarray:多维数组对象 In [121]: data = np.random.randn(2,3) In [122]: data Out[122]: array([[ 0.54913133, 1.22840566, -0.2471307 ], [ 1.13488389, -0.94895987, 1.06972625]]) In [123]: data *...

脚本代码 2023-03-22 218 标签: python 数据分析

阅读详细

python Numpy Matplotlib 绘图库

python numpy Matplotlib 绘图库介绍 Matplotlib 是 Python 的绘图库。它可与 NumPy 一起使用，提供了一种有效的 MatLab 开源替代方案。它也可以和图形工具包一起使用，如 PyQt 和 wxPython。 pip3 安装： pip3 install matplotlib -i https://pypi.tuna.tsinghua.edu.cn/s...

numpy基础 2023-03-22 283 标签: python 数据分析

阅读详细

python numpy模块

numpy介绍 numpy是Python支持大量数据进行科学计算的库，可对多维数据对象、矩阵快速操作，numpy 模板的核心是ndarray对象，这个对象封装同种类型的n维数组，将许多操作留在编译代码中执行，进而提高性能，numpy官网。numpy的使用场景一般在数据分析科学计算方面，可与，atplotlib(绘图库)一起使用，可视化数据分析结果。 numpy安装与使用 numpy是三方库，编码过...

脚本代码 2023-03-22 382 标签: python 数据分析

阅读详细

user_photo default icons

catroom

学习给人智慧，对真理而言，信服比流言更危险。

热门文章

最新文章