对于这个问题,相信很多人都会很困惑,本篇文章将会给大家介绍一种非常简单的方式向DataFrame中任意指定的位置添加一列。
在此之前或许有不少读者已经了解了最普通的添加一列的方式,如下:
import pandas as pd feature = pd.read_csv("C://Users//Machenike//Desktop//xzw//lr_train_data.txt", delimiter="\t", header=None, usecols=[0, 1]) feature.columns = ["a","b"] print(feature.head()) feature['c']='1' print(feature.head())
这种添加方式得到的结果如下:
a b 0 4.459256 8.225418 1 0.043276 6.307400 2 6.997162 9.313393 3 4.754832 9.260378 4 8.661904 9.767977 a b c 0 4.459256 8.225418 1 1 0.043276 6.307400 1 2 6.997162 9.313393 1 3 4.754832 9.260378 1 4 8.661904 9.767977 1
同样的也会有人想到concat()函数(关于concat()函数的更多介绍,可以参考我的另外一篇博客《在Pandas中DataFrame数据合并、连接(concat、merge、join)的实例》),如下:
import pandas as pd feature = pd.read_csv("C://Users//Machenike//Desktop//xzw//lr_train_data.txt", delimiter="\t", header=None, usecols=[0, 1]) feature.columns = ["a","b"] print(feature.head()) feature = pd.concat([feature, pd.DataFrame(columns=list('c'))]) print(feature.head())
利用concat()函数添加的结果如下:
a b 0 4.459256 8.225418 1 0.043276 6.307400 2 6.997162 9.313393 3 4.754832 9.260378 4 8.661904 9.767977 a b c 0 4.459256 8.225418 NaN 1 0.043276 6.307400 NaN 2 6.997162 9.313393 NaN 3 4.754832 9.260378 NaN 4 8.661904 9.767977 NaN
上述两种方法添加一列存在一个弊端,那就是只能在DataFrame的末尾即最后一列添加。但是在有些情况下,我们需要在DataFrame的第一列或中间列位置添加新的一列,那么,有没有一种方法可以指定位置添加一列呢?答案是肯定的,这就是本文一开始所说的那种及其简单的方法。
如下:
import pandas as pd feature = pd.read_csv("C://Users//Machenike//Desktop//xzw//lr_train_data.txt", delimiter="\t", header=None, usecols=[0, 1]) feature.columns = ["a","b"] print(feature.head()) feature = feature.reindex(columns=list('cab'), fill_value=1) print(feature.head())
上面代码中的使用了reindex()方法,reindex()方法可以添加一列或多列数据,并且可以指定列的位置,也可以对原先存在的列进行重排。方法中的columns属性控制着列的位置,c是添加的一列,其位于a和b前面,这说明c列是新数据框的第一列,fill_value属性指定的是添加一列的值,其结果如下:
a b 0 4.459256 8.225418 1 0.043276 6.307400 2 6.997162 9.313393 3 4.754832 9.260378 4 8.661904 9.767977 c a b 0 1 4.459256 8.225418 1 1 0.043276 6.307400 2 1 6.997162 9.313393 3 1 4.754832 9.260378 4 1 8.661904 9.767977
同时,reindex()方法也可以同时添加多列(其实上面的concat()函数也可以添加多列,添加方式与reindex()一样),如下:
import pandas as pd feature = pd.read_csv("C://Users//Machenike//Desktop//xzw//lr_train_data.txt", delimiter="\t", header=None, usecols=[0, 1]) feature.columns = ["a","b"] print(feature.head()) feature = feature.reindex(columns=list('cabd'), fill_value=1) print(feature.head())
我们添加了c、d两列,结果如下:
a b 0 4.459256 8.225418 1 0.043276 6.307400 2 6.997162 9.313393 3 4.754832 9.260378 4 8.661904 9.767977 c a b d 0 1 4.459256 8.225418 1 1 1 0.043276 6.307400 1 2 1 6.997162 9.313393 1 3 1 4.754832 9.260378 1 4 1 8.661904 9.767977 1
你们在此过程中遇到了什么问题,欢迎留言,让我看看你们都遇到了哪些问题。
以上这篇使用Python向DataFrame中指定位置添加一列或多列的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持。
免责声明:本站资源来自互联网收集,仅供用于学习和交流,请遵循相关法律法规,本站一切资源不代表本站立场,如有侵权、后门、不妥请联系本站删除!
RTX 5090要首发 性能要翻倍!三星展示GDDR7显存
三星在GTC上展示了专为下一代游戏GPU设计的GDDR7内存。
首次推出的GDDR7内存模块密度为16GB,每个模块容量为2GB。其速度预设为32 Gbps(PAM3),但也可以降至28 Gbps,以提高产量和初始阶段的整体性能和成本效益。
据三星表示,GDDR7内存的能效将提高20%,同时工作电压仅为1.1V,低于标准的1.2V。通过采用更新的封装材料和优化的电路设计,使得在高速运行时的发热量降低,GDDR7的热阻比GDDR6降低了70%。
更新日志
- 那英《如今》引进版[WAV+CUE][1G]
- 蔡幸娟.1991-真的让我爱你吗【飞碟】【WAV+CUE】
- 群星.2024-好团圆电视剧原声带【TME】【FLAC分轨】
- 陈思安.1990-国语钢琴酒吧5CD【欣代唱片】【WAV+CUE】
- 莫文蔚《莫后年代20周年世纪典藏》3CD[WAV+CUE][2G]
- 张惠妹《我要快乐》华纳[WAV+CUE][1G]
- 罗大佑1982《之乎者也》无法盗版的青春套装版 [WAV+CUE][1G]
- 曾庆瑜1989-款款柔情[日本东芝版][WAV+CUE]
- Scelsi-IntegraledesquatuorsacordesetTrioacordes-QuatuorMolinari(2024)[24bit-WAV]
- 房东的猫2017-房东的猫[科文音像][WAV+CUE]
- 杨乃文.2016-离心力(引进版)【亚神音乐】【WAV+CUE】
- 群星.2024-珠帘玉幕影视原声带【TME】【FLAC分轨】
- 芝麻龙眼.2008-光阴隧道民歌记录3CD【乡城】【WAV+CUE】
- 谭艳《再度重相逢HQII》头版限量[低速原抓WAV+CUE][549M]
- ABC唱片《蔡琴三十周年纪念版》6N纯银镀膜 [WAV+CUE][1.1G]