大家做数据清洗一般用的是哪个库 哪些方法?
西南交大开源 发布于2020-05-06 12:04 浏览:1315 回复:23
0
收藏

我喜欢用pandas   isnull

收藏
点赞
0
个赞
共23条回复 最后由189******30回复于2020-05-10 22:11
#24189******30回复于2020-05-10 22:11:45

真金白银的金融市场~~用不靠谱的数据训练自己都不知道原理的模型是~~用老话说叫“找不幸福”

0
#23189******30回复于2020-05-10 22:10:35

我看过在图像识别上有个日本的哥们发文搞过很成功的“单像素攻击”。只改一个像素,就把分类网络搞傻了

0
#22189******30回复于2020-05-10 22:08:47

做金融序列分析,每个步骤都得明明白白自己来,糊涂不得啊~~哈哈

0
#21189******30回复于2020-05-10 22:08:01
#16 西南交大开源回复
资金量不大就不要用这些

我是想学学那些专业工具的思路

0
#20人间月天回复于2020-05-09 20:16:46
#17 西南交大开源回复
不然光手续费你可能都付不起

大佬玩股票是不是很厉害

0
#19西南交大开源回复于2020-05-09 09:50:08
#14 鹿鼎记肯定回复
那必须是三大法宝啊, 别的还不会, 只能先用matplotlib, pandas, numpy
展开

现在也有专门的数据清洗库

0
#18何必固執回复于2020-05-08 17:46:51

听了大佬们的讨论 真的收获很大

0
#17西南交大开源回复于2020-05-08 11:03:03
#15 doubi渣渣回复
这是打算炒股了吗?听说不少算法在金融时序数据上表现还不如自回归,不过有用遗传算法成功的。
展开

不然光手续费你可能都付不起

0
#16西南交大开源回复于2020-05-08 11:02:35
#15 doubi渣渣回复
这是打算炒股了吗?听说不少算法在金融时序数据上表现还不如自回归,不过有用遗传算法成功的。
展开

资金量不大就不要用这些

0
#15doubi渣渣回复于2020-05-07 21:29:33
#11 189******30回复
金融序列数据有什么专用的数据清洗包么?尤其是发现、处理异常值得方法?

这是打算炒股了吗?听说不少算法在金融时序数据上表现还不如自回归,不过有用遗传算法成功的。

0
#14鹿鼎记肯定回复于2020-05-07 20:12:13

那必须是三大法宝啊, 别的还不会, 只能先用matplotlib, pandas, numpy

0
#13西南交大开源回复于2020-05-07 16:55:48
#11 189******30回复
金融序列数据有什么专用的数据清洗包么?尤其是发现、处理异常值得方法?

很多公司也专门有自己的

0
#12西南交大开源回复于2020-05-07 16:55:34
#11 189******30回复
金融序列数据有什么专用的数据清洗包么?尤其是发现、处理异常值得方法?

0
#11189******30回复于2020-05-07 13:28:05

金融序列数据有什么专用的数据清洗包么?尤其是发现、处理异常值得方法?

0
#10西南交大开源回复于2020-05-07 10:18:26
#7 doubi渣渣回复
一般用树模型,生产场景的缺失值总感觉处理了在应用的时候效果会变差

在数据分析  建模的时候影响不大

0
#9西南交大开源回复于2020-05-07 09:19:04
#7 doubi渣渣回复
一般用树模型,生产场景的缺失值总感觉处理了在应用的时候效果会变差

我是觉得如果缺失值低于3%  就没必要管了

0
#8doubi渣渣回复于2020-05-06 21:49:33

有时候图简单会用pandas库直接去除空值

0
#7doubi渣渣回复于2020-05-06 21:48:22

一般用树模型,生产场景的缺失值总感觉处理了在应用的时候效果会变差

0
#6西南交大开源回复于2020-05-06 12:10:25

删除不完整的行  就用dropna(how='all')

0
#5西南交大开源回复于2020-05-06 12:09:44
#4 西南交大开源回复
然后处理缺失数据  一般有三种方法 : 去掉/删除缺失率高的列 为缺失数据赋值默认值 去掉/删除缺失数据行
展开

填充null值的方法是fillna  可以用默认mean  或者是众数等等   根据实际的需求 这样可以让数据更漂亮

0
TOP
切换版块