Python Pandas タプルから階層的なインデックスを生成する方法

2021年9月28日

結論

pd.MultiIndex.from_tuples() でタプルからMultiIndexを作成する。

df.index = pd.MultiIndex.from_tuples(tupled_index)

MultiIndexは「階層的なIndex」を表す

連続数字や日付などさまざまなデータをインデックスにできるPandaのIndexですが、複数の列（または行）を行名として指定できるのがMultiIndexです。

１つの行に対して、複数のIndexが貼られているイメージですね。

このメリットはデータを特定しやすくすること。

少ないデータだったら単一のIndexで上手く処理できますが、巨大なデータセットとなると前処理だけでも大変な時間がかかります。

そこで、あらかじめ１つの行に対し複数のラベルを付けておくことで比較的扱いやすくなるかもしれません。

タプルから階層的なIndexを作成する

具体的な例で見てみましょう。

データは適当にランダムに生成します。

data = np.random.randn(10)
df = pd.DataFrame(data)

print(df)
#           0
# 0 -0.965032
# 1  1.498792
# 2 -1.087072
# 3 -0.581198
# 4 -0.242347
# 5 -1.685222
# 6 -0.871249
# 7 -1.542947
# 8 -0.259282
# 9  0.762048

この段階ではデフォルトで、連続整数のIndex（RangeIndex）が自動で設定されています。

ここで目的の多層階層的なIndexを設定してみます。

タプルのリスト(list)をpd.MultiIndex.from_tuples()関数に渡してあげてIndexオブジェクトを取得し、それをdf.indexに指定します。

# 10行分のデータに合わせてインデックスを指定
tupled_index = [
    ('alpha', 'foo'),
    ('alpha', 'bar'),
    ('alpha', 'baz'),
    ('beta', 'foo'),
    ('beta', 'bar'),
    ('beta', 'baz'),
    ('gumma', 'foo'),
    ('gumma', 'foo'),
    ('gumma', 'bar'),
    ('gumma', 'baz'),
]

df.index = pd.MultiIndex.from_tuples(tupled_index)

print(df)

#                   0
# alpha foo -0.965032
#       bar  1.498792
#       baz -1.087072
# beta  foo -0.581198
#       bar -0.242347
#       baz -1.685222
# gumma foo -0.871249
#       foo -1.542947
#       bar -0.259282
#       baz  0.762048

階層的なインデックスが生成されました。

Pythonの学習法について

Python の勉強が辛くなっていませんか？

Pythonは比較的取り組みやすい言語と言われていますが、プログラミング初心者にとっては分からないことだらけ。

ゼロから独学で勉強するのは厳しい道のりです。

今回、様々な現場、システム、言語を経験してきた現役エンジニアの立場から、初心者でも挫折しない学習方法を解説する記事を書きました。もちろん、お金をかけずに習得できる方法も解説しています。

プロが実践するPythonの挫折しない学習法

できるだけストレスがかからない勉強法を解説しているので、ぜひ参考にしてみてくださいね。

今回参考にした資料

pandas.MultiIndex.from_tuples — pandas 1.3.2 documentation

PandasのMultiIndexについて理解する – DeepAge

この記事タイトルとURLをコピー

次世代ペンギン

長いのでペンギンとお呼びください。システム開発・プログラミングのお仕事をしています。甘味とコーヒーは生命線。多くの人に役立つ情報のシェアが目標です。

comment コメントをキャンセル

: Python Tech
[Python]インスタンス変数に文字列を指定してアクセスする方法
Pythonのインスタンス変数にアクセスするとき、変数名を文字列で指定して取得したいときがあります。この記事ではそんな実装をPythonの標準機能で実現する方法を解説し ...

: Python Tech 辞書
Python 辞書 dictで使われるハッシュとは？キーから値を検索するハッシュテーブル
Pythonではキー・バリュー型の変数として辞書（Dict）が提供されています。他の言語では連想配列などと呼ばれるものです。辞書型ではキーを与えると、非常に高速に該当す ...

: Python Tech 文字列
Python 文字列を分割してリスト化する方法の一覧
Pythonの文字列を分割する方法について解説しています。文字列を分割するテクニックは様々です。区切り文字（スペースやタブ含む）で分割改行文字で分割パターンにマッ ...

: Tech WordPress
[WordPress] 超高速に見出しをつける作業効率化の基本！
ブログやSNSで稼いでいる人も、プログラミングなどで稼いでる人も、WordPressで記事投稿して情報発信する機会は多いのではないでしょうか。共通して言えるのは、「一分 ...

: Python SQLAlchemy Tech
Python NaNを含むデータをMySQLに保存したいとき（コードとエラー対処）
Pythonでデータ処理した後にMySQLなどのデータベースに保存する操作の話題です。 Pythonにまだ慣れていないという人でも、Pandasなどで処理したデータをデー ...

[初心者向け] Python if文でエラーを補足する？そこは「例外処理」にしましょう！

WordPressテーマTHORでjQuery Lightboxが正常に動作しないときの対処

Python Pandas タプルから階層的なインデックスを生成する方法

結論

MultiIndexは「階層的なIndex」を表す

タプルから階層的なIndexを作成する

Pythonの学習法について

今回参考にした資料

フリーランスのプログラマーになるには？現役のプロがまとめました

【2021年】プログラミングスクール厳選３校とおすすめの選び方現役エンジニアが教える失敗を避けるテクニック

フリーランスのプログラマーに必要なスキル一覧【これがないから稼げない】

Vuetify v-progress-circularでロード中表示をする書き方まとめ

vuexで１つのwatchハンドラで複数のstate変更を監視する方法 [$store.watch()] Vue2