R
otexts.com Time series regression modelsの教科書を探していたらみつけたのでご紹介。 ちょっと頑張って読んでみようかと思います
www.youtube.com いつのまにかRStudioのチャンネルがPositになってる。 びっくりした。
R for Data Scienceの2版で充実したところは間違いなくデータのimport周りだなぁと思うので、ちょっと比較してみます。 ちなみに初版のデータのimportは r4ds.had.co.nz のパートのみです。 もちろん2版でも r4ds.hadley.nz csvファイルをimportする過程に…
色々とtwitter apiが使えなくなっていく中でこれは大丈夫なのかと思うところがあり、少し書いてみます。 単純にsearch_tweets()関数が使えなくなったので、原因がなんなのかが全くわからなくて困っています。 一応、developerアカウントがあり、そちらからロ…
twitterのAPIが変わって大丈夫かなと思ったけどまだ使えます。 よかったよかった。しかし、twitterもあまり状況が良くないね
github.com twitter apiが色々変わってちゃんと使えるのか少し不安になっています。 今の所アナウンスは出ていません。もっとも自前で各種キーを持っている人は多そうだからヘビーに使う人には関係ない人のほうが多そうな印象ですが……
epirhandbook.com一応疫学会Weekなのでそれに絡んだネタを紹介。 R使いはそこまで多くない印象ですが、限られた予算の中である程度ちゃんとやれるとなるとRがまだまだいいのかなぁと思わないでもないです。もっともいつまで続くかはわかりませんが…… そのう…
r4ds.hadley.nz まぁ、さすがにだいぶ時間が経ったので更新が必要かなとは思う。 日本語版が出るのは初版みたいに大幅な改変をやるのであれば2〜3年ぐらいかかりそうなので、日本語で初版を買っても……だいぶ雰囲気変わっている印象はあるから待ってもいい…
www.rdocumentation.org rtweet関数を用いてtwitterのタイムラインから特定のワードを含むtweetを抽出するときにどうやっても1週間分しか出てこないなぁと思ってドキュメンテーションを見てみたら ONLY RETURNS DATA FROM THE PAST 6-9 DAYS. とのこと。 ww…
paizaのスキルアップラーニングでRがbetaテスト段階とはいえ使えるようになるらしい。 大変喜ばしいことである一方で、正直Rで競技プログラミング的な話は全くやらないので標準入力すらわからない。 もちろんサンプルコードもない。ということで調べてみた。…
shohei-doi.github.io 日本語で良さげな教材を見つけたのでご紹介。 分かりやすいなぁと思いながら眺めている。
注意書き 当該記事には「Rではじめるデータサイエンス」のネタバレを多数含みます。 自分で回答することが一番の力になりますのでなるべく自力で回答するようよろしくお願いいたします。 1. dep_timeとsched_dep_timeとは見やすいが、連続的な数になっていな…
注意書き 当該記事には「Rではじめるデータサイエンス」のネタバレを多数含みます。 自分で回答することが一番の力になりますのでなるべく自力で回答するようよろしくお願いいたします。 1. flightsからdep_time、dep_delay、arr_time、arr_delayを選ぶ方法…
注意書き 当該記事には「Rではじめるデータサイエンス」のネタバレを多数含みます。 自分で回答することが一番の力になりますのでなるべく自力で回答するようよろしくお願いいたします。 1. 欠損値を頭から整列させるためにarrange()をどのように使えば良い…
STATAだと.のような欠損値(missing values)はどの値よりも大きいという扱いになっているのだけど、RはNAの扱いはどうなのか調べてみたけど、ドキュメントに記載がなくて悩む。cran.r-project.org cranのイントロにもなし。 www.rdocumentation.org RDocume…
RMeCabをMac、しかもUTF-8環境で使いたいという条件で色々やって大変だったので、過程をメモしておきます。 ついでにcondaをメインで使っている都合上、Homebrewはインストールしないものとして環境を構築します。また、前提としてXcodeからコンパイラーはイ…
.Rprofileの日本語のフォントの設定をどうしたらいいものか非常に迷う。 今のMontereyに入っているデフォルトの日本語フォントってなんだっけ? って顔をしている。
注意書き 当該記事には「Rではじめるデータサイエンス」のネタバレを多数含みます。 自分で回答することが一番の力になりますのでなるべく自力で回答するようよろしくお願いいたします。 1. 積み上げ棒グラフをcoord_polar()を使って円グラフに変換しなさい …
注意書き 当該記事には「Rではじめるデータサイエンス」のネタバレを多数含みます。 自分で回答することが一番の力になりますのでなるべく自力で回答するようよろしくお願いいたします。 1. このプロットの問題は何か。どうすれば改善できるか。 2. geom_jit…
1. stat_summary()のデフォルトgeomは何か。stat関数ではなくgeom関数を用いて先ほどのコードを書き直すにはどうするか これなんだけど、?stat_summary()で調べてもこれといって参考になる回答が出てこないので困る。ggplot2-book.org ggplot2のいつもの本を…
注意書き 当該記事には「Rではじめるデータサイエンス」のネタバレを多数含みます。 自分で回答することが一番の力になりますのでなるべく自力で回答するようよろしくお願いいたします。 1.連続変数でファセットを作ったらどうなるか? では、実際に連続変数…
www.youtube.com 非常に英語が聞き取りやすくて好感が持てる。 動画もわかりやすいのでヨシ!
ggplot2の勉強をしていて、aes属性のcolourに文字列のデータを突っ込むと何が起きるのかよくわからないというお話です。よくわからないんだ。
PCが吹っ飛んだりした時用のバックアップとして、今使っているRのパッケージたちを残しておこうと思う。 これをRスクリプトにコピペして実行すればいつでも手持ちの環境が復元できるという算段だ。 # tidyverse関係 packages_r4ds <- c("tidyverse", "nycfli…
色々あってRを学ぼうと思ったので、 Rではじめるデータサイエンス | Hadley Wickham, Garrett Grolemund, 大橋 真也, 黒川 利明 |本 | 通販 | Amazon の日本語版(初版)をベースに回答集を作ってみようかと。 もう、何番煎じだと言われそうですが、実際にコ…
STATAにはtable1_mcという便利なユーザーアドインがある。 ざっくり説明すると 項目名 男 女 p-value 身長(cm)/ Mean(SD) 168.2 (5.5) 155.4 (4.2) 0.001 体重(kg)/ Mean(SD) 67.4 (10.5) 55.2 (7.2) 0.021 BMI / Mean(SD) 23.0 (4.0) 22.2 (7.2) …
さて、「Rで始めるデータサイエンス(英語版はAmazon | R for Data Science: Import, Tidy, Transform, Visualize, and Model Data | Wickham, Hadley, Grolemund, Garrett | Applied)」である。 TidyverseをつかったRの教科書としてはこれ以上なく良い本で…