天天看點

python量化分析庫 Backtrader入門之四

python量化分析庫 Backtrader入門之四

  在入門之三中,我們學到了如何設定初始的本金。擁有現金是很有趣的,但這所做一切的目的是設定一種自動化的政策,通過操作我們視為資料饋送的資産,在不動手指的情況下就能成倍的獲得現金。本次課就來和大家分享一下,如何給backtrader提供資料。

from __future__ import (absolute_import, division, print_function,
                        unicode_literals)

import datetime  # For datetime objects
import os.path  # To manage paths
import sys  # To find out the script name (in argv[0])

# Import the backtrader platform
import backtrader as bt

if __name__ == '__main__':
    # Create a cerebro entity
    cerebro = bt.Cerebro()

    # Datas are in a subfolder of the samples. Need to find where the script is
    # because it could have been called from anywhere
    modpath = os.path.dirname(os.path.abspath(sys.argv[0]))
    datapath = os.path.join(modpath, '../../datas/orcl-1995-2014.txt')

    # Create a Data Feed
    data = bt.feeds.YahooFinanceCSVData(
        dataname=datapath,
        # Do not pass values before this date
        fromdate=datetime.datetime(2000, 1, 1),
        # Do not pass values after this date
        todate=datetime.datetime(2000, 12, 31),
        reverse=False)

    # Add the Data Feed to Cerebro
    cerebro.adddata(data)

    # Set our desired cash start
    cerebro.broker.setcash(100000.0)

    # Print out the starting conditions
    print('Starting Portfolio Value: %.2f' % cerebro.broker.getvalue())

    # Run over everything
    cerebro.run()

    # Print out the final result
    print('Final Portfolio Value: %.2f' % cerebro.broker.getvalue())           

  這個代碼需要的資料是從yahoo财經上擷取的資料,不過就個人的使用經驗來說。這個資料對國内使用者來說,好像不太友好。經常出現無法通路,或者通路逾時的情況。不過backtrader給我們提供了多種資料格式的形式。

  我們先看一下示例中的數字提供形式,其核心代碼是:

data = bt.feeds.YahooFinanceCSVData(
        dataname=datapath,
        fromdate=datetime.datetime(2000, 1, 1),
        todate=datetime.datetime(2000, 12, 31),
        reverse=False)      

可以看出,是通過雅虎财經的csv檔案提供的資料。這個接口當然對我們國内使用者太不友好。我建議使用另外的接口,示例如下:

    data = bt.feeds.PandasData(dataname=dataframe,                               

                            fromdate=datetime.datetime(2019, 1, 1),                               

                            todate=datetime.datetime(2020, 5, 31)                               

        ) 

這個接口是提供的dataframe格式的資料,是不是很熟悉。當然這個dataframe格式的資料需要一定的格式,要求是時間類型索引,列名為'open','high','low','close','volume', 'openinterest'。按照時間增序排列。

知道這個接口後,就可以通過各種管道,比如爬蟲,tushare等抓取資料,然後進行回測。

繼續閱讀