域名和空间网站,开发公司资质查询,线上网站设计,海兴县做网站前言
有些人看到这个问题觉得不是问题#xff0c;是嘛#xff0c;不就是df.col[]函数嘛#xff0c;其实忽略了一个重点#xff0c;那就是我们要省去把csv文件全部读取这个过程#xff0c;因为如果在面临亿万级别的大规模数据#xff0c;得到的结果就是boom#xff0c;bo…前言
有些人看到这个问题觉得不是问题是嘛不就是df.col[]函数嘛其实忽略了一个重点那就是我们要省去把csv文件全部读取这个过程因为如果在面临亿万级别的大规模数据得到的结果就是boomboomboom。
我们要使用一下现成的函数里面的参数nrows,和skiprows一个代表你要读几行一个代表你从哪开始读这就可以了比如从第3行读取4个
示例代码
import pandas as pd
df pd.DataFrame({a:[1,2,3,4,5,6,7,8,9],b:[22,33,44,55,66,77,88,99,10]})
df.to_csv(test.csv)
dt pd.read_csv(test.csv,skiprows5,nrows3)
print(dt)
out:
4 5 66
0 5 6 77
1 6 7 88
2 7 8 99
3 8 9 10
就可以了不过这个列头不知道是怎么回事顺便如果想根据列值找index可以参考下面的
然后
df pd.DataFrame({BoolCol: [1, 2, 3, 3, 4],attr: [22, 33, 22, 44, 66]},
index[10,20,30,40,50])
print(df)
a df[(df.BoolCol3)(df.attr22)].index.tolist()
print(a)
df pd.DataFrame({BoolCol: [1, 2, 3, 3, 4],attr: [22, 33, 22, 44, 66]},
index[10,20,30,40,50])
print(df)
a df[(df.BoolCol3)(df.attr22)].index.tolist()
print(a)
问题得到了解决
总结
以上就是这篇文章的全部内容了希望本文的内容对大家的学习或者工作具有一定的参考学习价值谢谢大家对谷谷点程序的支持。