空飛ぶチンアナゴの統計解析日記

統計解析を嗜むチンアナゴのメモ帳です

コードを書く意味とは

GUIをメインに使ってできるようなSAS*1とかSPSSとかではなく、STATAやR、pythonを使うにあたってはコードを書くことが求められます。STATAは一応GUIがありますが、RやpythonにはGUIがないので何をするにしてもコードを書いて計算させたり、図表を描かせる必要があります。

そもそもコードの書き方を覚えるメリット

コードの書き方を覚えるメリットは

  1. 作業の自動化
  2. 作業の記録と再現性の担保

の二つです。

作業の自動化とは

コードが書けるようになることで「2000年から2020年までの20年分の毎月のデータを表にしといて、男女別で!」といった上司からのクソ面倒くさい指示もコンピューターに全部押し付けることができます。20年x12ヶ月x2種類(男女)の計480個の表をいちいち人間の手で操作してやるよりかは、コンピューターにやらせたほうが爆速で正確です。他にも「あっ、ついでに男女合計もお願い」とかいうナメた指示が後から飛んできてもコードをちょいちょいっと弄ればあとはコンピューターがやってくれるので、240個の表を夜を徹して書き出さずに済みます。

作業の記録と再現性の担保とは

作業の記録と再現性の担保についてはコードを書いてコンピューターにやらせることで、作業の手順は嫌でも記録されますし、同じコードを打ち込めばランダムな要素がない限りは人間と違って毎回同じ結果が出てくるので再現性も担保されます。

なお、基本的にSTATAやR、pythonのコードを書く時は、各言語のインタプリタ*2に直接コードを打ち込むのではなく、メモ帳のようなテキストエディタ*3に一旦コードを書いてから、インタプリタに読ませることが基本になります。

まとめ

人間繰り返しやる作業はミスるわ、数ヶ月前のことどころか1週間前のことは大抵覚えていないのが常なのでコードを書いてコンピューターにやらせた方が手早く確実に作業手順も忘れずに安定して作業できますよということです。
コンピューターに指示を出すにはコードを書くことが必要になるので、コードの書き方を覚えておいて基本的に損することはないですよというお話でした。

*1:SAS Studioは本当使い勝手がいい

*2:書いたコードをコンピューターの言葉に翻訳してコンピューターに伝えるソフト。RであればRをダウンロードした時にアプリケーションフォルダーにいるあいつのことだ

*3:Microsoft Wordではない。あれはワープロソフトだ