R學習筆記系列—統計數據之R語言數據類型日期值和缺失值

1.3.3 日期及時間值

從技術上說,日期值和時間值不屬於基本數據類型,因為其在在R內部表示為數值型。但從使用者的角度來看,日期值和時間值也是一種基本的常用數據類型。

1.日期值

日期值表示日期,存儲的是自1970年1月1日以來的天數。日期值的輸入通過字元串進行,即用函數 as.Date("date","format") 將字元串轉化為日期,其中 date 為要輸入的日期的字元串表示形式,format 為日期的格式,默認為「%Y-%m-%d」或「%Y/%m/%d」。也可以用format(date,"format")將已有的日期轉化為別的格式。

格式意義
%d日期,01-31
%a星期,縮寫
%A星期,完整
%j一年中的第幾天
%m月份,01-12
%b月份,縮寫
%B月份, 完整
%y年份,兩位數字
%Y年份,四位數字

部分日期轉換符號如上表所示,更詳細的請查看幫助文檔。

Advertisements

2.時間值

時間值表示時間,在 R 內部用自1970年1月1日 0時0分0秒 以來的秒數表示。時間值用as.POSIXct("time","format")的形式輸入,也可以用 format 函數進行格式轉換,與時間有關的主要轉換符號如下表所示。

格式意義
%H24進位小時,00-23
%I12進位小時,01-12
%M分鐘,00-59
%S秒數,00-59

可以用Sys.time()獲取當前時間。

小提示: unclass()函數可以去除對象的類,其概念涉及到R的對象系統,比較複雜,我們在後面的章節中將會逐漸涉及到。此處只需要記住,它可以將獲得的日期值或者時間值還原為整數。

3.日期和時間的運算

由於在 R 內部存儲為整數,因此日期值和時間值非常容易進行算數運算(日期值可以和日期值運算,不能和時間值混合運算)。

Advertisements

1.3.4 缺失值

在實際的數據分析項目中,經常有數據因為未作答等因素導致不完整或者不可用,在 R 中用 NA 表示。可以用函數 is.na() 來判斷對象是否為 NA 。

小提示 缺失值是不可比較和運算的,任何對象與缺失值比較或者預算都會返回一個缺失值,包括缺失值自身。

Advertisements

你可能會喜歡