Pandas

列名を抽出する

DataFrame についてカラム名（列名）を抽出する方法を確認してみよう．まずは，準備として GitHub のリポジトリにあるサンプルデータ (clustering-sample.csv) を読み込みます．

CSV ファイルを読み込む
import pandas as pd
url = "https://github.com/rinsaka/sample-data-sets/blob/master/clustering-sample.csv?raw=true"
df = pd.read_csv(url)
print(df)

      ID       x       y
0      0  7.4346  6.6520
1      1  6.5419  6.3611
2      2  8.9819  9.2461
3      3  3.8554  4.8386
4      4  1.9527  3.4848
..   ...     ...     ...
295  295  4.1205  1.5010
296  296  9.2843  1.7563
297  297  6.6627  7.3856
298  298  5.7654  6.0543
299  299  2.2411  1.0902

[300 rows x 3 columns]

DataFrameのカラム名（列名）を取得するには df.columns[index] を使います．

インデックス1のカラム名を抽出する
df.columns[1]

'x'

インデックス2のカラム名を抽出する
df.columns[2]

'y'

すべてのカラム名は df.columns で取り出すことが可能です．


df.columns

Index(['ID', 'x', 'y'], dtype='object')

すべてのカラムを順に取り出して何らかの処理をしたい場合は for を使うと良いでしょう．


for title in df.columns:
    print(title)

ID
x
y

さらに enumerate() も併用すると列のインデックスと列名を取得できます．


for i, title in enumerate(df.columns):
    print(f"{i}列目のカラム名は「{title}」です")

0列目のカラム名は「ID」です
1列目のカラム名は「x」です
2列目のカラム名は「y」です

目次に戻る

« 戻る次へ »