Pandas の DataFrame を Python のリストに変換する方法を確認してみよう.まずは,準備として GitHub のリポジトリにあるサンプルデータ (clustering-sample.csv) を読み込みます.
CSV ファイルを読み込む
import pandas as pd
url = "https://github.com/rinsaka/sample-data-sets/blob/master/clustering-sample.csv?raw=true"
df = pd.read_csv(url)
print(df)
ID x y 0 0 7.4346 6.6520 1 1 6.5419 6.3611 2 2 8.9819 9.2461 3 3 3.8554 4.8386 4 4 1.9527 3.4848 .. ... ... ... 295 295 4.1205 1.5010 296 296 9.2843 1.7563 297 297 6.6627 7.3856 298 298 5.7654 6.0543 299 299 2.2411 1.0902 [300 rows x 3 columns]
Pandas の DataFrame を Python のリストに変換するには .tolist()
を使います.例えば,x列をリストに変換して,表示してみよう.
Python リストに変換する
x = df['x'].tolist()
print(x)
[7.4346, 6.5419, 8.9819, 3.8554, 1.9527, ...(中略)..., 4.1205, 9.2843, 6.6627, 5.7654, 2.2411]
データ型を確認してみます.
データ型を確認する
type(x)
list
df['x']
だけでなく,df.loc[:, 'x']
や df.iloc[:,1]
でも .tolist()
を使えます.
Python リストに変換する
x = df.loc[:, 'x'].tolist()
print(x)
[7.4346, 6.5419, 8.9819, 3.8554, 1.9527, ...(中略)..., 4.1205, 9.2843, 6.6627, 5.7654, 2.2411]
Python リストに変換する
x = df.iloc[:,1].tolist()
print(x)
[7.4346, 6.5419, 8.9819, 3.8554, 1.9527, ...(中略)..., 4.1205, 9.2843, 6.6627, 5.7654, 2.2411]