Rで何かをしたり、読書をするブログ
id:cross_hyou
KaggleのTitanicのデータの分析8- Fareの分析、Fareは高いほうが生存確率は高い。
Photo by David Marcu on Unsplash www.crosshyou.info の続きです。 今回は、Fareです。はじめにsummary()関数でNAの有無や最大値などを確認します。 NAが一つありましたので、これを平均値の33.295にしてしまいます。 Fareは運賃ですね。ヒストグラムでtrain, test別に分布状況をみてみます。 同じような分布の感じです…