当前位置: 首页 > 面试题库 >

Python中带宽方法的投资组合重新平衡

羊舌青青
2023-03-14
问题内容

我们需要计算2只股票的不断重新平衡的投资组合。让我们将它们称为A和B。它们都应具有投资组合的相等部分。因此,如果我的投资组合中有100美元,则有50美元投向了A,而50美元投向了B。由于两种股票的表现都大相径庭,它们将无法保持相等的权重(3个月后,A可能已经价值70美元,而B下降至45美元$)。问题在于,他们必须将自己的投资组合份额保持在一定的公差范围内。该带宽为5%。因此,我需要一个执行以下功能的函数:如果A>
B * 1.05或A * 1.05 <B,则重新平衡。

第一部分仅以最快的方式使某些数据具有共同的讨论基础并使结果具有可比性,因此您只需复制并粘贴整个代码即可使用。

import pandas as pd
from datetime import datetime
import numpy as np


df1 = pd.io.data.get_data_yahoo("IBM", 
                                start=datetime(1970, 1, 1), 
                                end=datetime.today())
df1.rename(columns={'Adj Close': 'ibm'}, inplace=True)

df2 = pd.io.data.get_data_yahoo("F", 
                                start=datetime(1970, 1, 1), 
                                end=datetime.today())
df2.rename(columns={'Adj Close': 'ford'}, inplace=True)

df = df1.join(df2.ford, how='inner')
del df["Open"]
del df["High"]
del df["Low"]
del df["Close"]
del df["Volume"]

现在,开始使用公式df.ibm/df.ibm[0]计算每种股票的相对表现。问题在于,一旦打破第一个带宽,就需要在公式df.ibm/df.ibm[0]中重置0,因为我们需要重新平衡并需要从该点开始计算。因此,我们将df.d用于此占位符函数,并将其设置为等于df.t,一旦带宽中断df.t基本上只是计算数据帧的长度,因此可以始终告诉我们“我们在哪里”。因此,此处开始实际计算:

tol = 0.05 #settintg the bandwidth tolerance
df["d"]= 0 # 
df["t"]= np.arange(len(df))
tol = 0.3

def flex_relative(x):
    if df.ibm/df.ibm.iloc[df.d].values < df.ford/df.ford.iloc[df.d].values * (1+tol):
        return  df.iloc[df.index.get_loc(x.name) - 1]['d'] == df.t
    elif df.ibm/df.ibm.iloc[df.d].values > df.ford/df.ford.iloc[df.d].values * (1+tol):
        return df.iloc[df.index.get_loc(x.name) - 1]['d'] == df.t
    else:
        return df.ibm/df.ibm.iloc[df.d].values, df.ford/df.ford.iloc[df.d].values



df["ibm_performance"], df["ford_performance"], = df.apply(flex_relative, axis =1)

问题是,我从代码的最后一行收到此错误,我尝试在其中使用 df.apply(flex_relative, axis =1)

ValueError: ('The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.all().', u'occurred at index 1972-06-01 00:00:00') 问题是错误语句的给定选项都不能解决我的问题,所以我真的不知道该怎么办…

到目前为止,我唯一发现的就是下面的链接,但是调用R函数对我来说不起作用,因为我需要将其应用于相当大的数据集,而且我可能还会对此函数进行优化,因此肯定需要内置python

手动(这不是处理大数据的好方法),我计算出重新平衡的第一个日期是: 03.11.1972 00:00:00

第一次重新平衡时数据帧的输出应如下所示:

                     ibm        ford        d   t   ibm_performance ford_performance
1972-11-01 00:00:00 6,505655    0,387415    0   107 1,021009107 0,959552418
1972-11-02 00:00:00 6,530709    0,398136    0   108 1,017092172 0,933713605
1972-11-03 00:00:00 6,478513    0,411718    0   109 1,025286667 0,902911702 # this is the day, the rebalancing was detected
1972-11-06 00:00:00 6,363683    0,416007    109 110 1,043787536 0,893602752 # this is the day the day the rebalancing is implemented, therefore df.d gets set = df.t = 109
1972-11-08 00:00:00 6,310883    0,413861    109 111 1,052520384 0,898236364
1972-11-09 00:00:00 6,227073    0,422439    109 112 1,066686226 0,879996875

多谢您的支持!

@亚历山大:是的,重新平衡将在第二天进行。

@maxymoo:如果在代码之后执行此代码,则将获得每只股票的投资组合权重,它们的权重不在45%到55%之间。介于75%和25%之间:

df["ford_weight"] = df.ford_prop*df.ford/(df.ford_prop*df.ford+df.ibm_prop*df.ibm) #calculating the actual portfolio weights
df["ibm_weight"] = df.ibm_prop*df.ibm/(df.ford_prop*df.ford+df.ibm_prop*df.ibm)

print df
print df.ibm_weight.min()
print df.ibm_weight.max()
print df.ford_weight.min()
print df.ford_weight.max()

我一个小时左右都没有尝试修复,但是没有找到。

我可以做些什么使这个问题更清楚吗?


问题答案:

这里的主要思想是根据美元而不是比率来工作。如果您跟踪ibm和福特股票的数量以及相对美元价值,则可以将重新平衡的标准表示为

mask = (df['ratio'] >= 1+tol) | (df['ratio'] <= 1-tol)

比率等于

    df['ratio'] = df['ibm value'] / df['ford value']

df['ibm value']df['ford value']代表实际美元价值。

import datetime as DT
import numpy as np
import pandas as pd
import pandas.io.data as PID

def setup_df():
    df1 = PID.get_data_yahoo("IBM", 
                             start=DT.datetime(1970, 1, 1), 
                             end=DT.datetime.today())
    df1.rename(columns={'Adj Close': 'ibm'}, inplace=True)

    df2 = PID.get_data_yahoo("F", 
                             start=DT.datetime(1970, 1, 1), 
                             end=DT.datetime.today())
    df2.rename(columns={'Adj Close': 'ford'}, inplace=True)

    df = df1.join(df2.ford, how='inner')
    df = df[['ibm', 'ford']]
    df['sh ibm'] = 0
    df['sh ford'] = 0
    df['ibm value'] = 0
    df['ford value'] = 0
    df['ratio'] = 0
    return df

def invest(df, i, amount):
    """
    Invest amount dollars evenly between ibm and ford
    starting at ordinal index i.
    This modifies df.
    """
    c = dict([(col, j) for j, col in enumerate(df.columns)])
    halfvalue = amount/2
    df.iloc[i:, c['sh ibm']] = halfvalue / df.iloc[i, c['ibm']]
    df.iloc[i:, c['sh ford']] = halfvalue / df.iloc[i, c['ford']]

    df.iloc[i:, c['ibm value']] = (
        df.iloc[i:, c['ibm']] * df.iloc[i:, c['sh ibm']])
    df.iloc[i:, c['ford value']] = (
        df.iloc[i:, c['ford']] * df.iloc[i:, c['sh ford']])
    df.iloc[i:, c['ratio']] = (
        df.iloc[i:, c['ibm value']] / df.iloc[i:, c['ford value']])

def rebalance(df, tol, i=0):
    """
    Rebalance df whenever the ratio falls outside the tolerance range.
    This modifies df.
    """
    c = dict([(col, j) for j, col in enumerate(df.columns)])
    while True:
        mask = (df['ratio'] >= 1+tol) | (df['ratio'] <= 1-tol)
        # ignore prior locations where the ratio falls outside tol range
        mask[:i] = False
        try:
            # Move i one index past the first index where mask is True
            # Note that this means the ratio at i will remain outside tol range
            i = np.where(mask)[0][0] + 1
        except IndexError:
            break
        amount = (df.iloc[i, c['ibm value']] + df.iloc[i, c['ford value']])
        invest(df, i, amount)
    return df

df = setup_df()
tol = 0.05
invest(df, i=0, amount=100)
rebalance(df, tol)

df['portfolio value'] = df['ibm value'] + df['ford value']
df['ibm weight'] = df['ibm value'] / df['portfolio value']
df['ford weight'] = df['ford value'] / df['portfolio value']

print df['ibm weight'].min()
print df['ibm weight'].max()
print df['ford weight'].min()
print df['ford weight'].max()

# This shows the rows which trigger rebalancing
mask = (df['ratio'] >= 1+tol) | (df['ratio'] <= 1-tol)
print(df.loc[mask])


 类似资料:
  • 1.自我介绍 2.内存对齐 所谓内存对齐,是为了让内存存取更有效率而采用的一种编译阶段优化内存存取的手段。 3.给了一个函数,让指出语法问题 虚函数不能是模板函数,为什么 4. 内存分区 5.堆和栈的区别 6.虚函数表存在哪个区 虚函数表在 .rodata ( Linux g++ );虚函数指针在对象里,对象在哪,虚函数指针就在哪。虚函数表在编译期生成。 7.new和malloc的区别,new的原

  • 第一部分:20道编程选择题 第二部分:3道编程题 #秋招##宽德投资#

  • 我试图计算每个公司股票收益的月自协方差,我遵循Bao,Pan和Wang(2011)构造了股票水平的非流动性测度,ILLQ。 具体地说,让 是股票i在t月d天的对数价格变化。然后,ILLIQ定义为 我想用Python实现。到目前为止,我已经找到了函数。 但是这个代码没有考虑我的df(股票i,时间t)的面板结构。 理想情况下,我愿意这样做。 但我得到了这个错误: 有什么建议吗?我试图创建一个for循环

  • 我做了一个基于距离公式的程序,但我不知道如何显示平方根请帮助Python 3代码:

  • 都是做过的题还做不出来就很悲伤。。。 100分钟,20选择,3编程 1. adceadaa 编码后最短需要 14 个比特? 2. TCP 第4次挥手包含 FIN;PSH FIN;ACK FIN;ACK 3. 32位单精度浮点数的十进制有效数字有 7 位 4. 树的度为4,度为1,2,3,4的节点个数为0,3,3,2,叶子结点有16个 5. 一个线程运行 n++;n++; 另一个线程运行 n+=2;

  • 上来就说你这项目实习都没啥想问的 就说随便问 linux内核版本号是什么,你当时用的是什么 c++文件读取方式,c用什么,区别 创建进程的函数有哪些,怎么改变进程的大小 创建失败的原因 socket里面read和send函数区别 read函数底层实现原理 ip报文头部格式具体有哪些东西都是干什么的 (ip报文我都说完了他非说不对….)#秋招#

  • 宽德一面(48min) 面试问题 快速排序的时间复杂度 快速排序是稳定的吗?举个简单的例子说明快速排序不稳定 冒泡排序和选择排序的复杂度是多少呢?他们两个在实际的情况中会有比较大的差异吗?哪一个常数比较大呢 C++和C有什么比较突出的点吗?请说一下更加本质的区别 STL中Vector的emplace_back了解过吗,如果让你实现你会怎么做,检测参数是否构成对象希望在编译的时候就给出错误 需要用C

  • 我有下面的代码,它按照预期工作: 我想知道是否有一种方法,只有一个orElseThrow-Part,或做它更少的冗余?