空飛ぶチンアナゴの統計解析日記

統計解析を嗜むチンアナゴのメモ帳です

Code In Place

codeinplace.stanford.edu If you'd like to be contacted when Code in Place 2024 begins recruiting, fill out this form! ということで今年もこちらもやるそうです。 えっ、やるの?Code in Place 2024 Interest Form とりあえず興味のある方はこちらの…

新年明けましておめでとうございます

www.youtube.com ハーバード大学のCS50の2024年版が公開されています。 いつもながらイントロがすごく凝ってるなぁと思いながら垂れ流しています。

こんなの公開されたらかなわん

***TECHブログ更新***サイバーエージェントAI事業本部の新卒技術研修でSQLの講義に使用した資料について簡単に紹介しますhttps://t.co/ZFkgwPAz8w— 株式会社AI Shift (@AIShift_PR) 2021年6月21日 www.ai-shift.co.jp 公開されたのがだいぶ前の資料に…

OS 10.10で使えるVSCode

code.visualstudio.com 1.55が最新らしい…… インストールしたら自動アップデートはもちろん切るようにしましょう。自動アップデートが行われると当然動かなくなります。

教科書

otexts.com Time series regression modelsの教科書を探していたらみつけたのでご紹介。 ちょっと頑張って読んでみようかと思います

%%stataを使った分析例

flying-spotted-garden-eel.hatenablog.com 前回はセットアップについて解説しましたが、今回は実際の解析について説明します。 とりあえず、Jupyter Notebookを起動して最初のセルに STATA_SYSDIR = "自分のstataのpath" import stata_setup stata_setup.co…

pystata導入編

基本的にマニュアルを見ればインストールできます。 www.stata.compythonでのデータ分析のためにAnacondaがインストールされている人は特に問題なくインストールできるはず。 追加でインストールすることが推奨されているパッケージである NumPy 1.9 or late…

STATAで解くFizzBuzz問題

みんな大好きFizzBuzz問題をSTATAでもやってみようという話 FizzBuzzってなんぞやという方は、下記のwikipediaを見てください ja.wikipedia.orgお品書き 今日のルール 共通コード 乱数の発生 FizzBuzzの表示 Fizzbuzzのコード Forvaluesを使ったコード while…

STATAにおけるKruskal-Wallis検定後の多重比較をどうするか問題

ANOVAに比べてKruskal-Wallis検定後の多重比較の記載が圧倒的に少ない気がするので色々書いてみます。 【参考事例】SPSSさんの場合 www.stats-guild.com IBM SPSS Statistics Algorithms.pdf(英語版のみ):PDF776枚目 The Kruskal-Wallis, Friedman and Ke…

Affinityは学会ポスターの作成ツールとしてどのくらい使えるのか?

affinity.serif.com 結論から言うと弱点をわかっていれば問題なく使えますよと言う話 パワーポイントからちょっといいソフトへのステップアップとしてはおすすめ (バージョン2.1は持ってないのでバージョン1での話です) Affinityの苦手なところ 縦書きの文…

独自のモジュールを考える(STATA編)

pythonで言うところのimport構文で自作のモジュールを読み込ませたいなというお話 今日のお題 「こんにちは、〇〇さん(〇〇は任意の名前)」と表示する関数display_helloが記載されているDoFile「display_hello.do」を作成しなさい。 「display_hello.do」…

グラフのテンプレート

www.lightstone.co.jp www.lightstone.co.jp地味に活用して欲しいLightStoneさん提供のSTATAのグラフのテンプレート STATAのグラフについて解説してあるものというと www.stata.com 公式の英語のcheat sheetsもありますが、そちらよりも実践的なのでおすすめ…

STATAを買うということ

STATAにも色々バージョンがあり、自費で買うとき迷うということはよくあると思います。 もちろん扱う予定のデータサイズによって違うけど、参考になれば幸いです。 取り扱えるデーターのサイズで考える www.stata.com Product features Stata/BE Stata/SE St…

Python for Data Analysis, 3e

wesmckinney.com ということでpandasの使い方といえば『コレ』みたいなイメージのある『Python for Data Analysis』の第3版がいつの間にか公開されていたようです。 First Openが去年の1月なのでちょっと前に公開されていたみたいですね。まだ、邦訳はされ…

すごく今更の話かもしれないけど

www.youtube.com いつのまにかRStudioのチャンネルがPositになってる。 びっくりした。

STATA 18が出ましたね

blog.stata.com STATA 16から17にアップグレードした時ほどの差はなさそう。www.stata.com ぱっと見のみんなに役立つ機能はtable1書き出し機能が公式についたところでしょうか? 正直あまり17からアップグレードするほどの価値があるかと言われるとちょっと…

dsを使いたい

pandasでよくある columns_name_list = df.columns みたいなことをSTATAでやりたいなぁという話。 マニュアル(https://www.stata.com/manuals/dds.pdf)によるとr(varlist)で取り出せるらしい。 ということで探してみた www.stata.com 単純にdsコマンドで取…

データのimport周りの進化

R

R for Data Scienceの2版で充実したところは間違いなくデータのimport周りだなぁと思うので、ちょっと比較してみます。 ちなみに初版のデータのimportは r4ds.had.co.nz のパートのみです。 もちろん2版でも r4ds.hadley.nz csvファイルをimportする過程に…

rtweetとtwitter api

R

色々とtwitter apiが使えなくなっていく中でこれは大丈夫なのかと思うところがあり、少し書いてみます。 単純にsearch_tweets()関数が使えなくなったので、原因がなんなのかが全くわからなくて困っています。 一応、developerアカウントがあり、そちらからロ…

rtweet

R

twitterのAPIが変わって大丈夫かなと思ったけどまだ使えます。 よかったよかった。しかし、twitterもあまり状況が良くないね

傾向スコアの使い方

www.jstage.jst.go.jp先日の学会で傾向スコアを使った交絡の調整の話が出ていたので調べてみたら、こんな文献が出てきたので紹介してみます。 確かにマッチングの道具の印象しかないけど、冷静に考えてみてたくさんある共変量を一つの変数にまとめた変数なわ…

twitter api

とりあえず、ESSENTIALで使う分にはそんなに問題なさそうですね、今の所。 これから前向きにデータを収集していく分にはESSENTIALで問題ないと思いますし、普通にrtweetやtweepyでrecent_searchで一週間ごとのデータを収集していけば問題なさそう。問題は後…

rtweet

R

github.com twitter apiが色々変わってちゃんと使えるのか少し不安になっています。 今の所アナウンスは出ていません。もっとも自前で各種キーを持っている人は多そうだからヘビーに使う人には関係ない人のほうが多そうな印象ですが……

感染症数理の入門書

https://amzn.to/3ZBjYUc 割と一人で読めるらしいので早速買ってみる。 本当に一人で読めるのかな。

中村好一先生の本

https://amzn.to/3m7WrLW みんな大好き「基礎から学ぶ 楽しい疫学」の中村好一先生の本 てっきりこの「基礎から学ぶ 楽しい疫学」の第4版で終わりかなと思っていたら、別の本も改定していました。 https://amzn.to/3m6c1rs ってamazonの発刊日をみたら2021…

読んでおきたい本

mixtape.scunning.com STATAのコードの書き方をさがしていたら偶然たどり着いた とりあえず因果推論の話みたいなのでちゃんと読んでみようと思います

放送大学を活用する

そういえば放送大学が出願期間だったということで放送大学に再入学するメリットをなんとなくまとめてみました。 みんなもおいでよ、放送大学。 アカデミックでコンピューターとソフトが買える 商用利用がないパンピーのみなさんにとって一番大事なのがこれ。…

Julia

Just ran a regression with about 100 million observations. In Stata (MP, 16): 97 minutes In Julia (using FixedEffectsModels.jl): 13 seconds. Wowza.— CJ Libassi (@clibassi) 2020年8月2日 そんなに差があるのかということでJulia覚えようと思いま…

疫学や公衆衛生のためのR

R

epirhandbook.com一応疫学会Weekなのでそれに絡んだネタを紹介。 R使いはそこまで多くない印象ですが、限られた予算の中である程度ちゃんとやれるとなるとRがまだまだいいのかなぁと思わないでもないです。もっともいつまで続くかはわかりませんが…… そのう…

手計算

やっぱり可能な限りベタ打ちでコード書いて統計計算をしてみるって大事だなぁと思う機会がありました。 https://amzn.to/3J88rXa 時間があったらこれも一通りやってみないとなぁ。