どの統計ソフトを使うべきか軸を考えてみた:初心者向け

Public Healthを大学院レベルで勉強するなら必ず何かしらの統計ソフトを使う機会に出くわすかと思います。

 

で、いろいろあるんですよね。ソフト。有名どころだとSASとかSPSSかな?

ぶっちゃけ生物統計家になりたいのでもないかぎり、複数のソフトに詳しくなる必要もないと思うので、ソフトを選ぶときの軸+ざっくりと今まで使用or見たことあるソフトウェアの雑感でも。

個人的な感想の域を超えないのでなんともだけど。

 

【主なソフト】

よく論文で見るのは

JMP、R、SASSPSS、STATAでしょうか。

特にSASSPSS、STATAは御三家的な扱いかと。

印象だとアメリカの疫学・統計人がよく使うのがSAS、いろんな国の社会調査とか心理学系の人たちがSPSS、イギリスを中心に経済・社会科学系の人たちがSTATAを使っている印象。

 

ちなみにこの中だとSASはライセンス料がバカ高くて有名です。

だから使っている人たちを見るとなんとなく選ばれた大学の選ばれた人たちっていう気がしてしまう今日このごろ。

生物統計家の求人広告にはよくSASの使用経験書いてあるんですよね。選ばれた人たちそれがBiostatistician・・・憧れるぜ・・・

あれ、でもそういえばR言語SAS上でも走らせることができるって聞いたけど、そしたらRの経験だけでもいいのかしら?

 

【使用経験】

自分が今のところ、使ったことあるのは、

1、JMP

2、R

3.SPSS

4.STATA

の4つ。

このなかだとRとSTATAはプログラミングっぽくコードを書いていくソフトで、

JMPとSPSSはインターフェースにあるメニューからクリックしていくタイプです。

 

【軸】

さてさてじゃあ選ぶ軸はなんなんだろうってことで、考えてみました。

とりあえず以下の4つかと

1.インターフェース

2.統計に対するスタンス

3.お金

4.周りの人がなに使ってるか

 

 

1.インターフェース

上でざっくり2つにソフトをわけましたが、まず使うソフトウェアのインターフェースである程度方向性が決まってくると思います。

コードをぐりぐりして、なんかプログラミングっぽいことやってるぜっていうなぞの優越感に浸りたいのなら、自由にいろいろキーボード打ちながらやりたいぜっていうならRかSTATA、いや別にクリックだけで済むならそれでよくねっていう人はJMPかSPSSを選べばいいかと。

 

+αでいうと、個人的にJMPとかSPSSつかってて思ったのは、メニューのどこにどんな手法があってパラメーターにどの変数つっこんで、みたいなのが慣れの問題だと思うので、使う手法がたいてい決まっている人はJMPかSPSS選べばいいんじゃないかと。

 

2.統計に対するスタンス

実はこのスタンスってとても重要な気がしていて、どういう場所でどれくらいの時間どういう用途で使いますか(使いたいか)ってことです。

 

たとえば用途でいうなら、

なんかいろいろしたい!解析だけじゃなくて機械学習とかにも興味あります!って人はもうRしかありません。もしくはPythonでもやっちゃいましょう。ある程度やるとデータサイエンティストなるバズワードへの世界が開けるかも。

 

場所で言うと

1セメスターしかない授業でしか使いません!っていうなら速攻4の周りが何使ってるかを気にしたほうがよいと思うのです。

 

3.お金

で、2のスタンスとも関ってくるのだけれど、いくら払うかですよ。ソフトウェアに。

上にあげた5つのなかで無料なのはRだけです。

あとはたぶん学校とか会社がライセンスもってればJMPとかSPSSとかSTATAを期限付きで無料で手に入れられるか、もしくは安く買えます。

お財布との相談だ!!

 

4.周りの人

クラスとか研究室で指定されたのがあったらそれを使いましょう。ビバ日本人。同一化。

 

 

あらためて書いてみて思ったけどこのテーマなんてこの辺

blog.datacamp.com

でも参考にしてもらえればよかったのか。