在删除行的过程中,我们使用的是drop方法。我们构建了一个DataFrame, 在构建的过程中指定了行索引,所以在通过dop方法来删除指定的行时需要传 递希望删除掉的行的行索引。由于可以删除掉多行,所以这时候我们传递的是一 个Iist。执行完这一行语句后,我们可以看到,蓝色箭头所指向的Day1和Dy2 这两行数据就被彻底删除掉了。 data {'name':['Joe', 'Cat‘,Mike‘,'Kia',y', ea:2012,2012,2013,2014,20141, Po1ntsi【4,24,31,2,3j} Points name year Day1 4 Joe 2012 Day2 24 Cat 2012 Day3 31 Mike 2013 Day4 2 Kim 2014 Day5 3 Amy 2014 dt.drop(['Day1','Day2']) Pointsname year Day3 31 Mike 2013 Day4 2 Km2014 Day5 3 Amy 2014 删除列也是通过dop方法来实现的。但是有区别:第一,我们传递进去的 索引是列索引;第二,我们需要增加一个参数Axis。Axis等于1,表示它是按照 列的方式来删除的。在前面drop的时候我们没有传入axis参数,也就是说,缺 省情况下drop方法是按照行来删除元素的,删除掉year这一列之后,我们可以 看到整个DataFrame里面就不再包含year这一列了
在删除行的过程中,我们使用的是 d瀅瀂瀃 方法。我们构建了一个 Da瀇aF瀅a瀀e, 在构建的过程中指定了行索引,所以在通过 d瀅瀂瀃 方法来删除指定的行时需要传 递希望删除掉的行的行索引。由于可以删除掉多行,所以这时候我们传递的是一 个 濿i瀆瀇。执行完这一行语句后,我们可以看到,蓝色箭头所指向的 Da瀌1 和 Da瀌2 这两行数据就被彻底删除掉了。 删除列也是通过 d瀅瀂瀃 方法来实现的。但是有区别:第一,我们传递进去的 索引是列索引;第二,我们需要增加一个参数 A瀋i瀆。A瀋i瀆 等于 1,表示它是按照 列的方式来删除的。在前面 d瀅瀂瀃 的时候我们没有传入 a瀋i瀆 参数,也就是说,缺 省情况下 d瀅瀂瀃 方法是按照行来删除元素的,删除掉 瀌ea瀅 这一列之后,我们可以 看到整个 Da瀇aF瀅a瀀e 里面就不再包含 瀌ea瀅 这一列了
Points name year Day1 4 Joe 2012 Day2 24 Cat 2012 Day3 31 Mike 2013 Day4 2 Kim 2014 Day5 3 Amy 2014 df.drop('year',axis=1) Points name Day1 4 Joe Day2 24 Cat Day3 31 Mike Day4 2 Kim Day5 3 Amy 我们为什么需要删除数据呢?在数据当中所谓不符合要求的数据通常是指 有缺失的情况,例如,在某一行中其某一列的取值是NaN。Python使用NaN来 表示这些缺失的数据。对于缺失的数据,它们将来会影响到数据分析的结果精度, 所以我们希望把这些行全部删除掉,所以我们首先找到包含的NN列,然后把 具体NN所在的行标识出来,然后把这些行删除掉,由剩下的行构成的就是不 再包含NaN的数据了。怎样删除所有缺失的数据呢?使用dropna这个函数。例 如,我们定义了一个新的DataFrame,人为地在里面插入了一行完全由NaN构 成的数据。在这个DataFrame上,我们调用dropna函数的时候就会看到这一行 由NaN构成的数据被删除掉了
我们为什么需要删除数据呢?在数据当中所谓不符合要求的数据通常是指 有缺失的情况,例如,在某一行中其某一列的取值是 NaN。P瀌瀇h瀂瀁 使用 NaN 来 表示这些缺失的数据。对于缺失的数据,它们将来会影响到数据分析的结果精度, 所以我们希望把这些行全部删除掉,所以我们首先找到包含的 NaN 列,然后把 具体 NaN 所在的行标识出来,然后把这些行删除掉,由剩下的行构成的就是不 再包含 NaN 的数据了。怎样删除所有缺失的数据呢?使用 d瀅瀂瀃瀁a 这个函数。例 如,我们定义了一个新的 Da瀇aF瀅a瀀e,人为地在里面插入了一行完全由 NaN 构 成的数据。在这个 Da瀇aF瀅a瀀e 上,我们调用 d瀅瀂瀃瀁a 函数的时候就会看到这一行 由 NaN 构成的数据被删除掉了