らふのプログラミングメモ

プログラミングメモです。

Python:pandasのDataFrameにデータを追加してみる(列の追加)

今回はDataFrameでの列の追加をまとめていきたいと思います。

 下準備

元データとなるdfを準備します。

import pandas as pd

data = {"name":["aaa","bbb","ccc"],"age":["18","20","22"],"add":["Tokyo","Osaka","Nagoya"]}

#dfにdataをいれる
df = pd.DataFrame(data)

dfのイメージ図

name age add
0 aaa 18 Tokyo
1 bbb 20 Osaka
2 ccc 22 Nagoya

実際にinsert()を使ってやってみよう

以下のデータを追加します。

score
80
85
90
#df.insert(loc,columns,value)
df_in = df.insert(0,"score",["80","85","90"])
  • 引数の説明
    loc : 挿入したいデータを何列目にいれたいかをここで設定。
    columns:列名
    value:挿入したいデータ

実行結果

dfのイメージ図

score name age add
0 80 aaa 18 Tokyo
1 85 bbb 20 Osaka
2 90 ccc 22 Nagoya

df_in 何もなし

これより、insert()を実行すると
元データ(df)側のデータが直接変更されたことがわかります。

元データ(df)をそのまま保持しつつ、返り値として新しいDataFrameに返す方法として
DataFrame同士を合体(?)させる方法もあります。

DataFrame A + DataFrame B = DataFrame C
(AとBのDataFrameを合体させたものを新しいCというDataFrameに入れる)

それについては、次回にまとめたいと思います。

<最終更新日:2021/08/17>
2021/08/17 投稿