使用BaoStock下载股票数据代码分享:
登录后复制
import baostock as bs
import pandas as pd
import datetime
'''
日线指标参数包括:'date,code,open,high,low,close,preclose,volume,amount,adjustflag,turn,tradestatus,pctChg,peTTM,pbMRQ,psTTM,pcfNcfTTM,isST'
周、月线指标参数包括:'date,code,open,high,low,close,volume,amount,adjustflag,turn,pctChg'
分钟指标参数包括:'date,time,code,open,high,low,close,volume,amount,adjustflag'
adjustflag:复权类型,默认不复权:3;1:后复权;2:前复权。已支持分钟线、日线、周线、月线前后复权。
'''
# 是否删除停盘数据
DROP_SUSPENSION = True
def update_stk_list(date = None):
# 获取指定日期的指数、股票数据
stock_rs = bs.query_all_stock(date)
stock_df = stock_rs.get_data()
stock_df.to_csv('./stk_data/all_list.csv', encoding = 'gbk', index = False)
stock_df.drop(stock_df[stock_df.code < 'sh.600000'].index, inplace = True)
stock_df.drop(stock_df[stock_df.code > 'sz.399000'].index, inplace = True)
stock_df = stock_df['code']
stock_df.to_csv('./stk_data/stk_list.csv', encoding = 'gbk', index = False)
return stock_df.tolist()
def load_stk_list():
df = pd.read_csv('./stk_data/stk_list.csv')
return df['code'].tolist()
def convert_time(t):
H = t[8:10]
M = t[10:12]
S = t[12:14]
return H + ':' + M + ':' + S
def download_data(stk_list = [], fromdate = '1990-12-19', todate = datetime.date.today(),
datas = 'date,open,high,low,close,volume,amount,turn,pctChg',
frequency = 'd', adjustflag = '2'):
for code in stk_list:
print("Downloading :" + code)
k_rs = bs.query_history_k_data_plus(code, datas, start_date = fromdate, end_date = todate.strftime('%Y-%m-%d'),
frequency = frequency, adjustflag = adjustflag)
datapath = './stk_data/' + frequency + '/' + code + '.csv'
out_df = k_rs.get_data()
if DROP_SUSPENSION and 'volume' in list(out_df):
out_df.drop(out_df[out_df.volume == '0'].index, inplace = True)
# 做time转换
if frequency in ['5', '15', '30', '60'] and 'time' in list(out_df):
out_df['time'] = out_df['time'].apply(convert_time)
out_df.to_csv(datapath, encoding = 'gbk', index = False)
if __name__ == '__main__':
bs.login()
# 首次运行
stk_list = update_stk_list(datetime.date.today() - datetime.timedelta(days = 31))
# 非首次运行
#stk_list = load_stk_list()
# 下载日线
download_data(stk_list)
# 下载周线
download_data(stk_list, frequency = 'w')
# 下载月线
download_data(stk_list, frequency = 'm')
# 下载5分钟线
download_data(stk_list, fromdate = '2020-6-1', frequency = '5', datas = 'date,time,open,high,low,close,volume,amount,adjustflag')
# 下载15分钟线
download_data(stk_list, fromdate = '2020-6-1', frequency = '15', datas = 'date,time,open,high,low,close,volume,amount,adjustflag')
# 下载30分钟线
download_data(stk_list, fromdate = '2020-6-1', frequency = '30', datas = 'date,time,open,high,low,close,volume,amount,adjustflag')
# 下载60分钟线
download_data(stk_list, fromdate = '2020-6-1', frequency = '60', datas = 'date,time,open,high,low,close,volume,amount,adjustflag')
bs.logout()
几点说明:
可以通过query_all_stock(date)获取指定日期的指数和股票数据,提取指数和股票代码后,就可以用于后续的各周期数据的下载。如果只需要下载股票数据,而不需要下载指数数据,可以使用返回结果的code字段进行过滤。
使用文末所附代码下载各周期数据前,需要新建相应文件夹。
日线、周线和月线、分钟数据所能下载的数据字段不同,可根据需求选择下载字段。
股票停牌时,对于日线,开、高、低、收价都相同,且都为前一交易日的收盘价,成交量、成交额为0,换手率为空。
因此,如果不需要这部分数据的话,需要进行数据过滤,删除volume为0的数据。此外,由于网络原因可能导致数据下载失败,引发访问volume字段时报错,因此需要做进一步条件判断处理,使下载程序能够继续执行。同时,如果想要更快速进行交易,也可以使用股票交易接口,可以实现实盘交易,精准提高一定的效率。