空飛ぶチンアナゴの統計解析日記

統計解析を嗜むチンアナゴのメモ帳です

グループごとに連番を振りたい

STATAで言う所の

bysort グループ名: egen = seq()

みたいなことをpython、pandasでやりたい。

実際にやってみる

bysortに相当するのはgroupby()メソッドになる。
pandas.pydata.org
さて、これでデータフレームを指定のグループでまとめられた。
あとはグループごとに連番を代入するだけ。
連番の代入はcumcount()メソッドを使う。
pandas.pydata.org
なのでメソッドチェーンを用いて

データーフレーム['連番を突っ込む列'] = データフレーム.groupby('まとめたいグループ名').cumcount()

となる。

参考資料

stackoverflow.com