--- title: "stat03" author: "Saburo Higuchi" date: "2019年6月7日" output: html_document --- # 準備 ```{r setup, include=FALSE} Sys.setlocale('LC_ALL','C') knitr::opts_chunk$set(echo = TRUE) # これは初期設定の呪文. さわらない. ``` コードチャンク ```{r} 1+2 # これはコメント ``` とインラインコード `r 1+2`を使って, 読者が過程と結果をわかるように書く. # データの読み込み データファイルを次のように(データフレーム型)変数 d に読み込む. データファイル内では#はコメント行, と指定. ```{r} d<-read.csv("stat03.csv",comment.char="#") ``` # 基本統計量 データの基本統計量は次の通り. ```{r} summary(d) ``` ただしQu.=quantile=分位数, Mean=(標本)平均値という意味. データフレームaのコラムb a$b は, Cの構造体やJavaのクラスのa.bのようなもの. ```{r} m<-mean(d$s) #標本平均値 v<-var(d$s) #不偏標本分散 sd<-sd(d$s) #不偏標本標準偏差 n<-length(d$s) #行数すなわちサンプルサイズ ``` ここでは代入したので結果は表示されない. Environment のValuesで見る. 結果を文書に含めるには, 改めて ```{r} m ``` のように書くか, 「標本平均値mは`r m`」, のように書く. # グラフ 箱ひげ図 ```{r} boxplot(d$s) ``` ヒストグラム ```{r} hist(d$r) hist(d$s,breaks=c(0.0,0.2,0.4,0.6,0.8,1.0)) # 階級を指定できる ``` # 標本比率 boolean 型のコラムflag1を追加. meanを使うと, 整数0,1に型変換して計算してくれる. ```{r} d$flag1<-(d$s>0.7) p<-mean(d$flag1) p ``` すなわち標本比率は`r p`. 関数 ifthen を使って, 数値型のコラムflag2を追加して計算することもできる. ```{r} d$flag2<-ifelse(d$s>0.7,1,0) #d$flag2 mean(d$flag2) ``` # 標本期待値 E[S]の信頼係数0.95の信頼区間は ```{r} m-1.96*sqrt(v/n) m+1.96*sqrt(v/n) ``` よって`r {{m-1.96*sqrt(v/n)}}` < mu < `r {{m+1.96*sqrt(v/n)}}`. E[R^3] の推定値は ```{r} d$r3<-d$r*d$r*d$r mean(d$r3) mean(d$r*d$r*d$r) ``` # 問題1 S<0.3 の標本比率を求めよう # 問題2 R^3 の母期待値を, 信頼係数0.95で区間推定しよう # 問題3 S^3 のヒストグラムを描こう