天天看點

Python中處理日期時間庫的使用方法(轉載)

用百分之20時間,學會解決百分之80的問題。

常用的庫有time、datetime。其中datetime庫是對time庫的封裝,是以使用起來更加便捷。date是指日期時間(年月日)處理,time往往更加細小的機關(小時分秒等)的時間處理。

一、datetime庫

datetime.date類

表示日期的類,常用的屬性有year、month、day。參數都為整數。

import datetime 
 
#任何一天 
someday = datetime.date(year=2018,month=1,day=1) 
someday
datetime.date(2018, 1, 1)      

日期的标準化格式符号

%a  星期的簡寫。如 星期三為Web      
%A  星期的全寫。如 星期三為Wednesday      
%b  月份的簡寫。如4月份為Apr      
%B  月份的全寫。如4月份為April       
%c:  日期時間的字元串表示。(如: 04/07/10 10:43:39)      
%d:  日在這個月中的天數(是這個月的第幾天)      
%f:  微秒(範圍[0,999999])      
%H:  小時(24小時制,[0, 23])      
%I:  小時(12小時制,[0, 11])      
%j:  日在年中的天數 [001,366](是當年的第幾天)      
%m:  月份([01,12])      
%M:  分鐘([00,59])      
%p:  AM或者PM      
%S:  秒(範圍為[00,61],為什麼不是[00, 59]      
%U:  周在當年的周數當年的第幾周),星期天作為周的第一天      
%w:  今天在這周的天數,範圍為[0, 6],6表示星期天      
%W:  周在當年的周數(是當年的第幾周),星期一作為周的第一天      
%x:  日期字元串(如:04/07/10)      
%X:  時間字元串(如:10:43:39)      
%y:  2個數字表示的年份      
%Y:  4個數字表示的年份      
%z:  與utc時間的間隔 (如果是本地時間,傳回空字元串)      
%Z:  時區名稱(如果是本地時間,傳回空字元串)      

以規定的格式傳回。

print(someday.strftime('%Y-%m-%d')) 
2018-01-01

print(someday.strftime('%Y/%m/%d'))
2018/01/01      

生成如‘2018-01-01’

someday.isoformat()
'2018-01-01'      

今天

datetime.date.today()
datetime.date(2018, 2, 27)      

根據給定的時間戮,傳回一個date對象

import time
 
datetime.date.fromtimestamp(time.time())
datetime.date(2018, 1, 4)      

datetime.time類

表示時間的類,參數包括hour、minute、second、microsecond。 time類的方法同datetime類。

看看isoformat、strftime方法會傳回什麼

sometime = datetime.time(hour=12,minute=50,second=12,microsecond=10) 
sometime
datetime.time(12, 50, 12, 10)      

時間的格式化處理

print(sometime.isoformat()) 
12:50:12.000010
 
print(sometime.strftime('%H:%M:%S')) 
12:50:12
 
print(sometime.strftime('%H::%M::%S'))
12::50::12      

datetime.datetime類

日期實踐類,常用的參數包含year、month、day、hour、minute、second、microsecond。但是至少要包含year、month、day三個參數。

datetime.datetime(year=2018,month=1,day=1,hour=12,minute=50,second=12,microsecond=10)
datetime.datetime(2018, 1, 1, 12, 50, 12, 10)      

隻含有年月日

datetime.datetime(2018,1,1)
datetime.datetime(2018, 1, 1, 0, 0)      

看看isoformat、strftime方法會傳回什麼

somedatetime = datetime.datetime(2018,1,1) 
 
#isoformat、strftime 
print(somedatetime.isoformat()) 
2018-01-01T00:00:00

print(somedatetime.strftime('%Y-%m-%d %H:%M:%S'))
2018-01-01 00:00:00      

datetime.timedelta類

表示時間間隔類,給一個時間點加上此類,即可得到一個新的時間。參數包含days、hours、minutes、seconds、microseconds。

#1天零1小時零1分零1秒又10毫秒的時間間隔 
 
datetime.timedelta(days=1,hours=1,minutes=1,seconds=1,microseconds=10)
datetime.timedelta(1, 3661, 10)      

35天間隔

datetime.timedelta(days=35)
datetime.timedelta(35)      

現在+/-時間間隔操作

print(datetime.datetime.now()) 
2018-01-04 23:59:37.437627
 
print(datetime.datetime.now()+datetime.timedelta(days=35)) 
2018-02-08 23:59:37.438283
 
print(datetime.datetime.now()-datetime.timedelta(days=35)) 
2017-11-30 23:59:37.438775
 
print(datetime.datetime.now()-datetime.timedelta(hours=10)) 
2018-01-04 13:59:37.438987
 
print(datetime.datetime.now()-datetime.timedelta(hours=10,days=1))
2018-01-03 13:59:37.439190      

二、time庫

常用的方法有time、localtime

import time
 
timestamp = time.time() 
print('時間戳: ',timestamp) 
時間戳:  1515081476.966094
 
locaoltime = time.localtime(timestamp) 
print('當地時間: ',locaoltime) 
當地時間:  time.struct_time(tm_year=2018, tm_mon=1, tm_mday=4, tm_hour=23, tm_min=57, tm_sec=56, tm_wday=3, tm_yday=4, tm_isdst=0)
 
#轉化為有格式的時間,如隻顯示年月日 
print(time.strftime('%Y-%m-%d %H:%M:%S',locaoltime))
2018-01-04 23:57:56      

三、pandas庫時間處理函數

擷取目前時間,并傳回年月日規範格式。形如 2017-01-04

常用的方法有:

pd.date_range() 生成一個時間段      
pd.bdate_range() 生成一個時間段,跟date_range()不同,可見下面代碼      
df.asfreq() 生成以一定時間間隔的序列      

根據始末時間生成時間段

pd.date_range(start, end, freq) 生成一個時間段

freq參數由英文(M D H Min 。。。)、英文數字結合。D表示一天,M表示一月如20D表示20天,5M表示5個月。

#生成20171011-20171030 
pd.date_range('20171011', '20171030',freq='5D') 
DatetimeIndex(['2017-10-11', '2017-10-16', '2017-10-21', '2017-10-26'], dtype='datetime64[ns]', freq='5D')      

根據起始向後生成時間段

pd.date_range(日期字元串, periods=5, freq='T') 生成一個時間段

periods :時間段長度,整數類型 

freq: 時間機關。月日時分秒。M D H ...

import pandas as pd 
#20171231 12:50時間點開始,生成以月為間隔,長度為5的時間段 
tm_rng = pd.date_range('20171231 12:50',periods=5,freq='M') 
 
print(type(tm_rng)) 
DatetimeIndex(['2017-12-31 12:50:00', '2018-01-31 12:50:00','2018-02-28 12:50:00', '2018-03-31 12:50:00',
 
print(tm_rng)
<class 'pandas.core.indexes.datetimes.DatetimeIndex'> 
'2018-04-30 12:50:00'],dtype='datetime64[ns]', freq='M')      

根據給定時間點向前(向後)生成時間段

pd.bdate_range(end,periods,freq) 根據end時間點開始,以freq為機關,向前生成周期為period的時間序列

pd.bdate_range(start,periods,freq) 根據start時間點開始,以freq為機關,向後生成周期為period的時間序列

#向前5天 
print(pd.bdate_range(end='20180101',periods=5,freq='D'))
DatetimeIndex(['2017-12-28', '2017-12-29', '2017-12-30', '2017-12-31','2018-01-01'],dtype='datetime64[ns]', freq='D')

#向後5天 
print(pd.bdate_range(start='20180101',periods=5,freq='D'))
DatetimeIndex(['2018-01-01', '2018-01-02', '2018-01-03', '2018-01-04','2018-01-05'],dtype='datetime64[ns]', freq='D')      

改變時間間隔

對dateframe或者series對象操作,更改對象中時間的時間間隔。
dateframe.asfreq(freq='時間間隔',method='填充方式',fill_value='對Nan值進行填充') 
freq格式:M D H Min 。。。與數字結合。如20D表示20天,5M表示5個月。 
method:有pad、backfill兩種填充方式
fill_value:缺失值更改為fill_value的值。      
#改變時間間隔,以20天為間隔 
tm_series.asfreq('20D',method='pad')
2017-12-31 12:50:00    0
2018-01-20 12:50:00    0
2018-02-09 12:50:00    1
2018-03-01 12:50:00    2
2018-03-21 12:50:00    2
2018-04-10 12:50:00    3
2018-04-30 12:50:00    4
Freq: 20D, dtype: int64

#改變時間間隔,以20天為間隔 
tm_series.asfreq('20D',method='backfill')
2017-12-31 12:50:00    0
2018-01-20 12:50:00    1
2018-02-09 12:50:00    2
2018-03-01 12:50:00    3
2018-03-21 12:50:00    3
2018-04-10 12:50:00    4
2018-04-30 12:50:00    4
Freq: 20D, dtype: int64

#改變時間間隔,以100小時為間隔 
tm_series.asfreq('100H')
2017-12-31 12:50:00    0.0
2018-01-04 16:50:00    NaN
2018-01-08 20:50:00    NaN
2018-01-13 00:50:00    NaN
.....
2018-04-10 12:50:00    NaN
2018-04-14 16:50:00    NaN
2018-04-18 20:50:00    NaN
2018-04-23 00:50:00    NaN
2018-04-27 04:50:00    NaN
Freq: 100H, dtype: float64

#改變時間間隔,以100小時為間隔 
tm_series.asfreq('100H',fill_value='缺失值')
2017-12-31 12:50:00      0
2018-01-04 16:50:00    缺失值
2018-01-08 20:50:00    缺失值
2018-01-13 00:50:00    缺失值
.....
2018-04-14 16:50:00    缺失值
2018-04-18 20:50:00    缺失值
2018-04-23 00:50:00    缺失值
2018-04-27 04:50:00    缺失值
Freq: 100H, dtype: object      

​可以統一日期格式​

data = pd.Series(['May 20, 2017','2017-07-12','20170930','2017/10/11','2017 12 11']) 
 
pd.to_datetime(data)
0   2017-05-20
1   2017-07-12
2   2017-09-30
3   2017-10-11
4   2017-12-11
dtype: datetime64[ns]      

​提取指定日期的資料​

如下tm_rng是以5小時時間間隔,生成了20個資料。我們隻要2018-01-02的資料。對Series或Dataframe都可以使用日期字元串操作,選取指定時間範圍的資料。

import pandas as pd 
import numpy as np
 
tm_rng = pd.date_range('2017-12-31 12:00:00',periods=20,freq='5H') 
tm_series = pd.Series(np.random.randn(len(tm_rng)), index=tm_rng) 
print(type(tm_series)) 
 
print(tm_series)
<class 'pandas.core.series.Series'> 
2017-12-31 12:00:00    0.618465
2017-12-31 17:00:00   -0.963631
2017-12-31 22:00:00   -0.782348
.....
2018-01-04 06:00:00   -0.681123
2018-01-04 11:00:00   -0.710626
Freq: 5H, dtype: floa64

#我們隻要tm_series中是2018-01-02的資料 
tm_series['2018-01-02']
2018-01-02 04:00:00    0.293941
2018-01-02 09:00:00   -1.437363
2018-01-02 14:00:00   -0.527275
2018-01-02 19:00:00    1.140872
Freq: 5H, dtype: float64

#我們要2018年的資料,結果全保留 
tm_series['2018']
2018-01-01 03:00:00   -0.363019
2018-01-01 08:00:00    0.426922
2018-01-01 13:00:00   -1.118425
2018-01-01 18:00:00    0.956300
.....
2018-01-03 20:00:00   -1.967839
2018-01-04 01:00:00   -0.654029
2018-01-04 06:00:00   -0.681123
2018-01-04 11:00:00   -0.710626
Freq: 5H, dtype: float64
dft = pd.DataFrame(np.random.randn(len(tm_rng)), index=tm_rng) 
 
print(type(dft)) 
print(dft)
<class 'pandas.core.frame.DataFrame'>
                            
2017-12-31 12:00:00  0.213331
2017-12-31 17:00:00  1.920131
2017-12-31 22:00:00 -1.608645
2018-01-01 03:00:00 -0.226439
2018-01-01 08:00:00 -0.558741
.....
 
2018-01-03 20:00:00  0.866822
2018-01-04 01:00:00 -0.361902
2018-01-04 06:00:00  0.902717
2018-01-04 11:00:00 -0.431569

#對dataframe中的時間操作,隻要2018-01-04日的資料 
print(type(dft['2018-01-04'])) 
print(dft['2018-01-04'])
<class 'pandas.core.frame.DataFrame'>
                            
2018-01-04 01:00:00 -0.361902
2018-01-04 06:00:00  0.902717
2018-01-04 11:00:00 -0.431569