Rで何かをしたり、読書をするブログ
id:cross_hyou
KaggleのTitanicのデータの分析4 - Ageの分析、10代、40代は比較的生存確率が高い。
Photo by Edouard TAMBA on Unsplash www.crosshyou.info 今回はAgeについて分析します。まずはsummary()関数でNAの有無や平均値などを確認します。 NAが263個もあります。最小値は0.17で最大値は80、平均値は29.88で中央値は28.00です。 NAがあるので、NAなら1、そうでないなら0というダミー変数と、NAなら0、そうでない…