Pythonの「リスト」は、データをまとめて扱える便利なデータ型ですが、さらに「リストの中にリスト」を格納することで、より複雑なデータ構造を表現できます。この構造は多次元リストと呼ばれ、データ分析においても非常に役立つスキルです。
この記事では、
- 多次元リストの基本
- データ分析での活用例
- 実際のコード例
を初心者にもわかりやすく解説します。
多次元リストとは?
多次元リストとは、「リストの中にリストを格納した構造」のことです。これを使うと、表形式や行列のようなデータを簡単に扱えるようになります。
具体例
次のコードは、3つのリストを1つのリストにまとめたものです。
出力結果:
この構造をわかりやすく言うと、「2行3列の表」に似ています。
data[0]
は[1, 2]
(1行目のデータ)data[1]
は[3, 4]
(2行目のデータ)
多次元リストの作成ポイント
多次元リストを扱う際のコツを以下にまとめます。
- 改行して書く
データが多くなるときは、見やすいように改行を入れて記述します。 - インデントを統一
リスト内の要素のインデントを揃えると、コードが読みやすくなります。
データ分析での多次元リストの活用例
データ分析の現場では、表形式のデータを扱うことがよくあります。多次元リストを使えば、簡単なデータの操作や分析が可能です。以下に具体例を挙げます。
1. 行列データの表現
例えば、次のような学生のテストの点数表を考えてみましょう。
活用例: 平均点の計算
各学生の平均点を計算するコードは以下の通りです。
出力結果:
2. CSVデータの簡易操作
CSVファイルから読み込んだデータを多次元リストに格納し、操作することも可能です。以下は、売上データの例です。
活用例: 日ごとの合計売上
出力結果:
3. データフレームを扱う前の練習
本格的なデータ分析では、Pandasを使ったデータフレーム操作が主流ですが、多次元リストを使えばデータフレームの基本的な構造や操作に慣れることができます。Pandasを学ぶ前の練習としても最適です。
注意点: 多次元リストの限界
多次元リストは便利ですが、データが大きくなると管理が難しくなります。そのため、大規模なデータ分析ではPandasなどの専用ライブラリを活用するのがおすすめです。
結論
多次元リストは、Python初心者が学ぶべき重要なスキルの一つです。特にデータ分析では、表形式のデータを扱う基礎として非常に役立ちます。今回の内容を参考に、以下を練習してみましょう。
- リストの中にリストを作成する
- 各行・列のデータを操作する
- 小規模なデータを使った分析を実践する
多次元リストに慣れたら、次はPandasやNumpyを使った高度な分析に挑戦してみてください!
この記事があなたのPython学習とデータ分析スキル向上の手助けになれば幸いです。
コメント