Python入門トップページ


目次

  1. Pandas とは
  2. Pandas を利用するための準備
  3. CSV ファイルを読み込む
  4. DataFrame を表示する
  5. 列や行を抽出する
  6. 列名を抽出する
  7. Python リストに変換する
  8. Python リストから DataFrame に変換する
  9. DataFrame から NumPy 配列に変換する
  10. 基本統計量を出力する
  11. CSV ファイルに書き出す
  12. グループ化とピボットテーブル
  13. データフレームの結合(系列名が等しいとき)
  14. データフレームの結合(系列名が異なるとき)
  15. データフレームの連結

Pandas

列名を抽出する

DataFrame についてカラム名(列名)を抽出する方法を確認してみよう.まずは,準備として GitHub のリポジトリにあるサンプルデータ (clustering-sample.csv) を読み込みます.

CSV ファイルを読み込む
import pandas as pd
url = "https://github.com/rinsaka/sample-data-sets/blob/master/clustering-sample.csv?raw=true"
df = pd.read_csv(url)
print(df)
      ID       x       y
0      0  7.4346  6.6520
1      1  6.5419  6.3611
2      2  8.9819  9.2461
3      3  3.8554  4.8386
4      4  1.9527  3.4848
..   ...     ...     ...
295  295  4.1205  1.5010
296  296  9.2843  1.7563
297  297  6.6627  7.3856
298  298  5.7654  6.0543
299  299  2.2411  1.0902

[300 rows x 3 columns]

DataFrameのカラム名(列名)を取得するには df.columns[index] を使います.

インデックス1のカラム名を抽出する
df.columns[1]
'x'
インデックス2のカラム名を抽出する
df.columns[2]
'y'

すべてのカラム名は df.columns で取り出すことが可能です.


df.columns
Index(['ID', 'x', 'y'], dtype='object')

すべてのカラムを順に取り出して何らかの処理をしたい場合は for を使うと良いでしょう.


for title in df.columns:
    print(title)
ID
x
y

さらに enumerate() も併用すると列のインデックスと列名を取得できます.


for i, title in enumerate(df.columns):
    print(f"{i}列目のカラム名は「{title}」です")
0列目のカラム名は「ID」です
1列目のカラム名は「x」です
2列目のカラム名は「y」です

目次に戻る