DataFrame についてカラム名(列名)を抽出する方法を確認してみよう.まずは,準備として GitHub のリポジトリにあるサンプルデータ (clustering-sample.csv) を読み込みます.
CSV ファイルを読み込む
import pandas as pd
url = "https://github.com/rinsaka/sample-data-sets/blob/master/clustering-sample.csv?raw=true"
df = pd.read_csv(url)
print(df)
ID x y 0 0 7.4346 6.6520 1 1 6.5419 6.3611 2 2 8.9819 9.2461 3 3 3.8554 4.8386 4 4 1.9527 3.4848 .. ... ... ... 295 295 4.1205 1.5010 296 296 9.2843 1.7563 297 297 6.6627 7.3856 298 298 5.7654 6.0543 299 299 2.2411 1.0902 [300 rows x 3 columns]
DataFrameのカラム名(列名)を取得するには df.columns[index]
を使います.
インデックス1のカラム名を抽出する
df.columns[1]
'x'
インデックス2のカラム名を抽出する
df.columns[2]
'y'
すべてのカラム名は df.columns
で取り出すことが可能です.
df.columns
Index(['ID', 'x', 'y'], dtype='object')
すべてのカラムを順に取り出して何らかの処理をしたい場合は for
を使うと良いでしょう.
for title in df.columns:
print(title)
ID x y
さらに enumerate()
も併用すると列のインデックスと列名を取得できます.
for i, title in enumerate(df.columns):
print(f"{i}列目のカラム名は「{title}」です")
0列目のカラム名は「ID」です 1列目のカラム名は「x」です 2列目のカラム名は「y」です