らふのプログラミングメモ

プログラミングメモです。

Python:pandasのSeriesにデータをいれてみよう

個人的にはSeriesをあまり使ったことないけれど、
せっかくなので今後使う時用にまとめてみます。

そもそもSeriesとDataFrameの違いとは?

まずは両者のイメージ図から。
(両者とも、インデックスやヘッダーを除いたデータのみのイメージ図を描きます)


                               
データ1
データ2
データ3
データ4
データ5
つづく・・・

Series(配列)のイメージ


                                                                             
データ1AAA10
データ2BBB20
データ3CCC15
データ4DDD25
データ5EEE30

DataFrameのイメージ(2次元の配列)のイメージ


このような配列にそれぞれインデックスをつけることが可能。
(デフォルトではインデックスは「0〜N」の通し番号で作られます。)

まずはやってみよう

  • 直接データを入力してみる(だけ)
import pandas as pd

#aaa,bbb,cccを追加してみる。
list = pd.Series(["aaa","bbb","ccc"])
                         
aaa
bbb
ccc

listのイメージ図

このような感じで、各データにインデックスが0から振られていきます。

  • インデックスも設定してみる
import pandas as pd

#aaa,bbb,cccにそれぞれインデックスとしてA,B,Cを入れてみる。
list = pd.Series(["aaa","bbb","ccc"],index = ["A","B","C"])
                         
Aaaa
Bbbb
Cccc

listのイメージ図

0、1、2と割り振られていたインデックスが、
指定通り、A、B、Cに変わります。

<最終更新日:2021/08/12>

2021/08/12 投稿