空飛ぶチンアナゴの統計解析日記

統計解析を嗜むチンアナゴのメモ帳です

R

教科書

otexts.com Time series regression modelsの教科書を探していたらみつけたのでご紹介。 ちょっと頑張って読んでみようかと思います

すごく今更の話かもしれないけど

www.youtube.com いつのまにかRStudioのチャンネルがPositになってる。 びっくりした。

データのimport周りの進化

R

R for Data Scienceの2版で充実したところは間違いなくデータのimport周りだなぁと思うので、ちょっと比較してみます。 ちなみに初版のデータのimportは r4ds.had.co.nz のパートのみです。 もちろん2版でも r4ds.hadley.nz csvファイルをimportする過程に…

rtweetとtwitter api

R

色々とtwitter apiが使えなくなっていく中でこれは大丈夫なのかと思うところがあり、少し書いてみます。 単純にsearch_tweets()関数が使えなくなったので、原因がなんなのかが全くわからなくて困っています。 一応、developerアカウントがあり、そちらからロ…

rtweet

R

twitterのAPIが変わって大丈夫かなと思ったけどまだ使えます。 よかったよかった。しかし、twitterもあまり状況が良くないね

rtweet

R

github.com twitter apiが色々変わってちゃんと使えるのか少し不安になっています。 今の所アナウンスは出ていません。もっとも自前で各種キーを持っている人は多そうだからヘビーに使う人には関係ない人のほうが多そうな印象ですが……

疫学や公衆衛生のためのR

R

epirhandbook.com一応疫学会Weekなのでそれに絡んだネタを紹介。 R使いはそこまで多くない印象ですが、限られた予算の中である程度ちゃんとやれるとなるとRがまだまだいいのかなぁと思わないでもないです。もっともいつまで続くかはわかりませんが…… そのう…

R4DSの2版が出るんですね

R

r4ds.hadley.nz まぁ、さすがにだいぶ時間が経ったので更新が必要かなとは思う。 日本語版が出るのは初版みたいに大幅な改変をやるのであれば2〜3年ぐらいかかりそうなので、日本語で初版を買っても……だいぶ雰囲気変わっている印象はあるから待ってもいい…

rtweetのsearch_tweets()関数

R

www.rdocumentation.org rtweet関数を用いてtwitterのタイムラインから特定のワードを含むtweetを抽出するときにどうやっても1週間分しか出てこないなぁと思ってドキュメンテーションを見てみたら ONLY RETURNS DATA FROM THE PAST 6-9 DAYS. とのこと。 ww…

paizaでRが使えるようになるらしい

R

paizaのスキルアップラーニングでRがbetaテスト段階とはいえ使えるようになるらしい。 大変喜ばしいことである一方で、正直Rで競技プログラミング的な話は全くやらないので標準入力すらわからない。 もちろんサンプルコードもない。ということで調べてみた。…

Rの教材

shohei-doi.github.io 日本語で良さげな教材を見つけたのでご紹介。 分かりやすいなぁと思いながら眺めている。

3.5 練習問題の解答と解説

注意書き 当該記事には「Rではじめるデータサイエンス」のネタバレを多数含みます。 自分で回答することが一番の力になりますのでなるべく自力で回答するようよろしくお願いいたします。 1. dep_timeとsched_dep_timeとは見やすいが、連続的な数になっていな…

3.4 練習問題の解答と解説

注意書き 当該記事には「Rではじめるデータサイエンス」のネタバレを多数含みます。 自分で回答することが一番の力になりますのでなるべく自力で回答するようよろしくお願いいたします。 1. flightsからdep_time、dep_delay、arr_time、arr_delayを選ぶ方法…

3.3 練習問題の解答と解説

注意書き 当該記事には「Rではじめるデータサイエンス」のネタバレを多数含みます。 自分で回答することが一番の力になりますのでなるべく自力で回答するようよろしくお願いいたします。 1. 欠損値を頭から整列させるためにarrange()をどのように使えば良い…

RのNAの扱い

STATAだと.のような欠損値(missing values)はどの値よりも大きいという扱いになっているのだけど、RはNAの扱いはどうなのか調べてみたけど、ドキュメントに記載がなくて悩む。cran.r-project.org cranのイントロにもなし。 www.rdocumentation.org RDocume…

RMeCabをMacで使いたいという話

R

RMeCabをMac、しかもUTF-8環境で使いたいという条件で色々やって大変だったので、過程をメモしておきます。 ついでにcondaをメインで使っている都合上、Homebrewはインストールしないものとして環境を構築します。また、前提としてXcodeからコンパイラーはイ…

わりと新しめのMacを使ったRの日本語化

.Rprofileの日本語のフォントの設定をどうしたらいいものか非常に迷う。 今のMontereyに入っているデフォルトの日本語フォントってなんだっけ? って顔をしている。

1.9 練習問題の回答と解説

注意書き 当該記事には「Rではじめるデータサイエンス」のネタバレを多数含みます。 自分で回答することが一番の力になりますのでなるべく自力で回答するようよろしくお願いいたします。 1. 積み上げ棒グラフをcoord_polar()を使って円グラフに変換しなさい …

1.8 練習問題の回答と解説

注意書き 当該記事には「Rではじめるデータサイエンス」のネタバレを多数含みます。 自分で回答することが一番の力になりますのでなるべく自力で回答するようよろしくお願いいたします。 1. このプロットの問題は何か。どうすれば改善できるか。 2. geom_jit…

1.7の練習問題で詰まっています

1. stat_summary()のデフォルトgeomは何か。stat関数ではなくgeom関数を用いて先ほどのコードを書き直すにはどうするか これなんだけど、?stat_summary()で調べてもこれといって参考になる回答が出てこないので困る。ggplot2-book.org ggplot2のいつもの本を…

1.5 練習問題の解答と解説

注意書き 当該記事には「Rではじめるデータサイエンス」のネタバレを多数含みます。 自分で回答することが一番の力になりますのでなるべく自力で回答するようよろしくお願いいたします。 1.連続変数でファセットを作ったらどうなるか? では、実際に連続変数…

R用のロジスティック回帰分析の動画

www.youtube.com 非常に英語が聞き取りやすくて好感が持てる。 動画もわかりやすいのでヨシ!

Rで始めるデータサイエンスの1.3の練習問題1.の解説

ggplot2の勉強をしていて、aes属性のcolourに文字列のデータを突っ込むと何が起きるのかよくわからないというお話です。よくわからないんだ。

万が一の時のためのあんちょこ(2021年版)

R

PCが吹っ飛んだりした時用のバックアップとして、今使っているRのパッケージたちを残しておこうと思う。 これをRスクリプトにコピペして実行すればいつでも手持ちの環境が復元できるという算段だ。 # tidyverse関係 packages_r4ds <- c("tidyverse", "nycfli…

Rで始めるデータサイエンスをちゃんとやろうねというお話

色々あってRを学ぼうと思ったので、 Rではじめるデータサイエンス | Hadley Wickham, Garrett Grolemund, 大橋 真也, 黒川 利明 |本 | 通販 | Amazon の日本語版(初版)をベースに回答集を作ってみようかと。 もう、何番煎じだと言われそうですが、実際にコ…

table1_mc的なそれ

STATAにはtable1_mcという便利なユーザーアドインがある。 ざっくり説明すると 項目名 男 女 p-value 身長(cm)/ Mean(SD) 168.2 (5.5) 155.4 (4.2) 0.001 体重(kg)/ Mean(SD) 67.4 (10.5) 55.2 (7.2) 0.021 BMI / Mean(SD) 23.0 (4.0) 22.2 (7.2) …

R for Data Science

R

さて、「Rで始めるデータサイエンス(英語版はAmazon | R for Data Science: Import, Tidy, Transform, Visualize, and Model Data | Wickham, Hadley, Grolemund, Garrett | Applied)」である。 TidyverseをつかったRの教科書としてはこれ以上なく良い本で…