Python:pandasのDataFrameにデータを追加してみる(列の追加)
今回はDataFrameでの列の追加をまとめていきたいと思います。
下準備
元データとなるdfを準備します。
import pandas as pd data = {"name":["aaa","bbb","ccc"],"age":["18","20","22"],"add":["Tokyo","Osaka","Nagoya"]} #dfにdataをいれる df = pd.DataFrame(data)
dfのイメージ図
name | age | add | |
---|---|---|---|
0 | aaa | 18 | Tokyo |
1 | bbb | 20 | Osaka |
2 | ccc | 22 | Nagoya |
実際にinsert()を使ってやってみよう
以下のデータを追加します。
score |
---|
80 |
85 |
90 |
#df.insert(loc,columns,value) df_in = df.insert(0,"score",["80","85","90"])
- 引数の説明
loc : 挿入したいデータを何列目にいれたいかをここで設定。
columns:列名
value:挿入したいデータ
実行結果
dfのイメージ図
score | name | age | add | |
---|---|---|---|---|
0 | 80 | aaa | 18 | Tokyo |
1 | 85 | bbb | 20 | Osaka |
2 | 90 | ccc | 22 | Nagoya |
df_in 何もなし
これより、insert()を実行すると
元データ(df)側のデータが直接変更されたことがわかります。
元データ(df)をそのまま保持しつつ、返り値として新しいDataFrameに返す方法として
DataFrame同士を合体(?)させる方法もあります。
DataFrame A + DataFrame B = DataFrame C
(AとBのDataFrameを合体させたものを新しいCというDataFrameに入れる)
それについては、次回にまとめたいと思います。
<最終更新日:2021/08/17>
2021/08/17 投稿