DataFrame.columnsの基本
PandasのDataFrameは、2次元のラベル付きデータ構造で、異なる型の列を持つことができます。DataFrame.columns
は、DataFrameの列ラベルを取得または設定するための属性です。
以下に、DataFrameの作成とcolumns
属性の基本的な使用方法を示します。
import pandas as pd
# データフレームの作成
data = {'Name': ['John', 'Anna', 'Peter'],
'Age': [28, 24, 35],
'City': ['New York', 'Paris', 'Berlin']}
df = pd.DataFrame(data)
# 列ラベルの表示
print(df.columns)
上記のコードを実行すると、以下のような出力が得られます。
Index(['Name', 'Age', 'City'], dtype='object')
これは、DataFrameの列ラベルを示しています。このように、DataFrame.columns
を使用すると、DataFrameの列名を簡単に確認できます。また、この属性を使用して列名を変更することも可能です。それについては次のセクションで詳しく説明します。
列名の設定と変更
PandasのDataFrameでは、columns
属性を使用して列名を設定または変更することができます。以下にその方法を示します。
import pandas as pd
# データフレームの作成
data = {'Name': ['John', 'Anna', 'Peter'],
'Age': [28, 24, 35],
'City': ['New York', 'Paris', 'Berlin']}
df = pd.DataFrame(data)
# 列名の変更
df.columns = ['名前', '年齢', '都市']
# 変更後の列名の表示
print(df.columns)
上記のコードを実行すると、以下のような出力が得られます。
Index(['名前', '年齢', '都市'], dtype='object')
このように、DataFrame.columns
を新しいリストに設定することで、DataFrameの全ての列名を一度に変更することができます。
また、特定の列名だけを変更したい場合は、rename
メソッドを使用します。
# 特定の列名の変更
df = df.rename(columns={'名前': '氏名'})
# 変更後の列名の表示
print(df.columns)
上記のコードを実行すると、以下のような出力が得られます。
Index(['氏名', '年齢', '都市'], dtype='object')
このように、rename
メソッドを使用すると、特定の列名だけを簡単に変更することができます。これらの機能を活用して、DataFrameの列名を効率的に操作することができます。次のセクションでは、これらの操作を活用した具体的な例を見ていきましょう。
列の操作例
ここでは、PandasのDataFrameの列に対する一般的な操作の例をいくつか示します。
列の選択
特定の列を選択するには、列名を指定します。
# '氏名'列を選択
name = df['氏名']
列の追加
新しい列を追加するには、新しい列名と値を指定します。
# 新しい列'職業'を追加
df['職業'] = ['Engineer', 'Doctor', 'Artist']
列の削除
列を削除するには、drop
メソッドを使用します。
# '都市'列を削除
df = df.drop('都市', axis=1)
列の並び替え
列の順序を変更するには、新しい順序で列名をリストとして指定します。
# 列の順序を変更
df = df[['職業', '氏名', '年齢']]
これらの操作を組み合わせることで、DataFrameの列に対して幅広い操作を行うことができます。これらの基本的な操作を理解し、適切に使用することで、データ分析の効率と精度を大幅に向上させることができます。次回は、これらの操作を活用した具体的なデータ分析の例を見ていきましょう。それでは、次回までにPandasの練習を忘れずに!