DataFrame.columnsの基本

PandasのDataFrameは、2次元のラベル付きデータ構造で、異なる型の列を持つことができます。DataFrame.columnsは、DataFrameの列ラベルを取得または設定するための属性です。

以下に、DataFrameの作成とcolumns属性の基本的な使用方法を示します。

import pandas as pd

# データフレームの作成
data = {'Name': ['John', 'Anna', 'Peter'],
        'Age': [28, 24, 35],
        'City': ['New York', 'Paris', 'Berlin']}
df = pd.DataFrame(data)

# 列ラベルの表示
print(df.columns)

上記のコードを実行すると、以下のような出力が得られます。

Index(['Name', 'Age', 'City'], dtype='object')

これは、DataFrameの列ラベルを示しています。このように、DataFrame.columnsを使用すると、DataFrameの列名を簡単に確認できます。また、この属性を使用して列名を変更することも可能です。それについては次のセクションで詳しく説明します。

列名の設定と変更

PandasのDataFrameでは、columns属性を使用して列名を設定または変更することができます。以下にその方法を示します。

import pandas as pd

# データフレームの作成
data = {'Name': ['John', 'Anna', 'Peter'],
        'Age': [28, 24, 35],
        'City': ['New York', 'Paris', 'Berlin']}
df = pd.DataFrame(data)

# 列名の変更
df.columns = ['名前', '年齢', '都市']

# 変更後の列名の表示
print(df.columns)

上記のコードを実行すると、以下のような出力が得られます。

Index(['名前', '年齢', '都市'], dtype='object')

このように、DataFrame.columnsを新しいリストに設定することで、DataFrameの全ての列名を一度に変更することができます。

また、特定の列名だけを変更したい場合は、renameメソッドを使用します。

# 特定の列名の変更
df = df.rename(columns={'名前': '氏名'})

# 変更後の列名の表示
print(df.columns)

上記のコードを実行すると、以下のような出力が得られます。

Index(['氏名', '年齢', '都市'], dtype='object')

このように、renameメソッドを使用すると、特定の列名だけを簡単に変更することができます。これらの機能を活用して、DataFrameの列名を効率的に操作することができます。次のセクションでは、これらの操作を活用した具体的な例を見ていきましょう。

列の操作例

ここでは、PandasのDataFrameの列に対する一般的な操作の例をいくつか示します。

列の選択

特定の列を選択するには、列名を指定します。

# '氏名'列を選択
name = df['氏名']

列の追加

新しい列を追加するには、新しい列名と値を指定します。

# 新しい列'職業'を追加
df['職業'] = ['Engineer', 'Doctor', 'Artist']

列の削除

列を削除するには、dropメソッドを使用します。

# '都市'列を削除
df = df.drop('都市', axis=1)

列の並び替え

列の順序を変更するには、新しい順序で列名をリストとして指定します。

# 列の順序を変更
df = df[['職業', '氏名', '年齢']]

これらの操作を組み合わせることで、DataFrameの列に対して幅広い操作を行うことができます。これらの基本的な操作を理解し、適切に使用することで、データ分析の効率と精度を大幅に向上させることができます。次回は、これらの操作を活用した具体的なデータ分析の例を見ていきましょう。それでは、次回までにPandasの練習を忘れずに!

投稿者 kitagawa

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です