Pandasで複数のデータフレームを作成する
Pandasライブラリを使用してPythonで複数のデータフレームを作成する方法を紹介します。まず、必要なライブラリをインポートします。
import pandas as pd
次に、2つの異なるデータフレームを作成します。ここでは、df1
とdf2
という名前のデータフレームを作成します。
# データフレーム1の作成
data1 = {
'A': ['A0', 'A1', 'A2', 'A3'],
'B': ['B0', 'B1', 'B2', 'B3'],
'C': ['C0', 'C1', 'C2', 'C3'],
'D': ['D0', 'D1', 'D2', 'D3'],
}
df1 = pd.DataFrame(data1)
# データフレーム2の作成
data2 = {
'A': ['A4', 'A5', 'A6', 'A7'],
'B': ['B4', 'B5', 'B6', 'B7'],
'C': ['C4', 'C5', 'C6', 'C7'],
'D': ['D4', 'D5', 'D6', 'D7'],
}
df2 = pd.DataFrame(data2)
これで、2つのデータフレームdf1
とdf2
が作成されました。次のステップでは、これらのデータフレームをどのように表示するかを見ていきます。それについては次の小見出しで詳しく説明します。
データフレームをグループ化して表示する
前のセクションで作成した2つのデータフレーム、df1
とdf2
をグループ化して表示する方法を見ていきましょう。ここでは、display
関数を使用してデータフレームを一度に表示します。
from IPython.display import display
# データフレームを表示
display(df1)
display(df2)
上記のコードを実行すると、df1
とdf2
が順番に表示されます。しかし、これらのデータフレームを同時に表示するにはどうすればよいでしょうか?
そのためには、display
関数をカスタマイズして複数のデータフレームを同時に表示する関数を作成します。
from IPython.display import display_html
def display_side_by_side(*args):
html_str=''
for df in args:
html_str+=df.to_html()
display_html(html_str.replace('table','table style="display:inline"'),raw=True)
# データフレームを同時に表示
display_side_by_side(df1, df2)
上記のdisplay_side_by_side
関数を使用すると、df1
とdf2
を同時に表示することができます。この関数は任意の数のデータフレームを引数として受け取り、それらを同時に表示します。
次のセクションでは、データフレームをHTMLテーブルとして表示する方法について説明します。それについては次の小見出しで詳しく説明します。
HTMLテーブルとしてデータフレームを表示する
Pandasのデータフレームは、そのままHTMLテーブルとして表示することも可能です。これは、Jupyter Notebookなどの環境でデータを視覚的に確認する際に非常に便利です。
まず、前のセクションで作成したdf1
とdf2
をHTMLテーブルとして表示してみましょう。
# データフレームをHTMLとして表示
display(HTML(df1.to_html()))
display(HTML(df2.to_html()))
上記のコードを実行すると、df1
とdf2
がHTMLテーブルとして表示されます。
さらに、複数のデータフレームを一度にHTMLテーブルとして表示することも可能です。以下にその方法を示します。
# 複数のデータフレームを一度にHTMLとして表示
html_str = ''
for df in [df1, df2]:
html_str += df.to_html()
display(HTML(html_str))
上記のコードを実行すると、df1
とdf2
が一度にHTMLテーブルとして表示されます。これにより、複数のデータフレームを一覧で確認することが容易になります。
以上が、Pandasを使用して複数のデータフレームを作成し、それらをグループ化して表示する方法、そしてHTMLテーブルとして表示する方法についての説明です。これらのテクニックを活用することで、データ分析作業がより効率的になることでしょう。次回は、さらに高度なデータ操作について学んでいきましょう。それでは、次回まで。