R學習筆記系列—統計數據之R語言數據類型日期值和缺失值
1.3.3 日期及時間值
從技術上說,日期值和時間值不屬於基本數據類型,因為其在在R內部表示為數值型。但從使用者的角度來看,日期值和時間值也是一種基本的常用數據類型。
1.日期值
日期值表示日期,存儲的是自1970年1月1日以來的天數。日期值的輸入通過字元串進行,即用函數 as.Date("date","format") 將字元串轉化為日期,其中 date 為要輸入的日期的字元串表示形式,format 為日期的格式,默認為「%Y-%m-%d」或「%Y/%m/%d」。也可以用format(date,"format")將已有的日期轉化為別的格式。
格式 | 意義 |
---|---|
%d | 日期,01-31 |
%a | 星期,縮寫 |
%A | 星期,完整 |
%j | 一年中的第幾天 |
%m | 月份,01-12 |
%b | 月份,縮寫 |
%B | 月份, 完整 |
%y | 年份,兩位數字 |
%Y | 年份,四位數字 |
部分日期轉換符號如上表所示,更詳細的請查看幫助文檔。
Advertisements
2.時間值
時間值表示時間,在 R 內部用自1970年1月1日 0時0分0秒 以來的秒數表示。時間值用as.POSIXct("time","format")的形式輸入,也可以用 format 函數進行格式轉換,與時間有關的主要轉換符號如下表所示。
格式 | 意義 |
---|---|
%H | 24進位小時,00-23 |
%I | 12進位小時,01-12 |
%M | 分鐘,00-59 |
%S | 秒數,00-59 |
可以用Sys.time()獲取當前時間。
小提示: unclass()函數可以去除對象的類,其概念涉及到R的對象系統,比較複雜,我們在後面的章節中將會逐漸涉及到。此處只需要記住,它可以將獲得的日期值或者時間值還原為整數。
3.日期和時間的運算
由於在 R 內部存儲為整數,因此日期值和時間值非常容易進行算數運算(日期值可以和日期值運算,不能和時間值混合運算)。
Advertisements
1.3.4 缺失值
在實際的數據分析項目中,經常有數據因為未作答等因素導致不完整或者不可用,在 R 中用 NA 表示。可以用函數 is.na() 來判斷對象是否為 NA 。
小提示 缺失值是不可比較和運算的,任何對象與缺失值比較或者預算都會返回一個缺失值,包括缺失值自身。