hack のためのネタ帳, etc,,,

統計処理用言語 S の GNU 版。
グラフプロットツールとしても使える他、ベクトル演算はお手の物なので画像処理だって楽々:-)
他にも数値シミュレーション等に使っても便利。

ライセンス

GPL

GUI Wrapper 等

参考になるページ等

参考になる書籍等

  • データサイエンティスト養成読本 / 特集1 データ分析実線入門 / 第5章 C4.5/k-means/サポートベクターマシン/アプリオリ/EM… データマイニングに必要な10のアルゴリズム, 技術評論社 (2013) pp.83-88.
    • 以下の10個のアルゴリズムが IEEE ICDM 2006 にて選ばれているということで、概要が紹介されている
    • C4.5: 改良版 C5.0 GNU R - C50?
    • k-means: GNU R - cluster?, clusGap() 関数
    • サポートベクターマシン(SVM): GNU R - e1071?, svm() 関数
    • アプリオリアルゴリズム
    • 期待値最大加法 (EM Algorithm: Expectation-Maximization Algorithm): GNU R - MFDA?, MFclust() 関数
    • ページランク
    • アダブースト
    • k-近傍分類
    • ナイーブベイズ: GNU R - bnlearn?, learn() 関数
    • 分類と回帰木 (CART: Classification And Regression Frees)

Web ベースの環境等


上記のうち、Tutorials Point Coding Ground と Repl.it は、以下のように repos 明示しておけばカレントディレクトリに対してはパッケージの追加が可能だった。
install.packages("pkgname",lib=".",repos="https://cran.r-project.org/")
library("pkgname",lib.loc=".")
また、Rextester、Tutorials Point Coding Ground、Repl.it、rdrr.io はプロットの出力も可能。
ただし、Tutorials Point Coding Ground は複数プロットした場合、最後の1つしか表示されない。

Memo

q() で終了する際、「Save workspace image? [y/n/c]: 」と聞かれるので、「y」と答えると、カレントディレクトリに .RData というファイルが生成され、終了時の変数等が保存され、次回起動時に復元される。
このデータはどうも gzip 圧縮されているらしく、
gzip -dc .RData | xxd
みたいにするとシリアライズされたバイナリデータを確認できる。
dplyr パッケージを追加しておくと、「%>%」によるパイプが利用可能となる。
length(x)      # 普通の関数呼び出し
x %>% length() # パイプによる関数呼び出し
地味に便利。

追記: 2019-06-27
dplyr だけじゃなく magrittr でも良いみたい。
参考:

関連

コメントをかく


「http://」を含む投稿は禁止されています。

利用規約をご確認のうえご記入下さい

Wiki内検索

フリーエリア

管理人/副管理人のみ編集できます