Pythonでは、リストに重複した要素があると、データの管理や集計が面倒になりますよね。そんな時に便利なのが、リストから重複を簡単に削除する方法です。
Pythonのsetを使うと、リストの重複を自動的に排除できます。setは重複を許さないデータ型なので、重複した要素は保存されません。
my_list = [1, 2, 2, 3, 4, 4, 5]\nunique_list = list(set(my_list))\nprint(unique_list)
このコードを実行すると、出力結果は以下のようになります。
[1, 2, 3, 4, 5]
setを使った方法では元の順序が保証されませんが、リスト内包表記を使うと元の順番を保ちながら重複を削除することができます。
my_list = [1, 2, 2, 3, 4, 4, 5]\nunique_list = []\n[unique_list.append(x) for x in my_list if x not in unique_list]\nprint(unique_list)
これを実行すると、元のリストの順番を維持した状態で重複が取り除かれ、以下のように出力されます。
[1, 2, 3, 4, 5]
データ分析を行う際には、pandasライブラリを使うのも良い手です。pandasではeasyに重複を削除できます。
import pandas as pd\nmy_list = [1, 2, 2, 3, 4, 4, 5]\ndf = pd.Series(my_list)\nunique_list = df.drop_duplicates().tolist()\nprint(unique_list)
こちらも実行すると、 mismas で重複が削除されたリストが得られます。
[1, 2, 3, 4, 5]
Pythonでは様々な方法でリストの重複を削除することができ、それぞれにメリットがあります。使うシチュエーションに応じて適切な方法を選んでみてくださいね。