我开始用AI来做投资分析了 | 方法论
新闻资讯
2023-06-06 20:34
58
0
最近,我在网上刷了一堆「教你怎么用AI赚钱」的视频。如果照着他们去做,比如去批量制作短视频什么的,或者批量出插画,最后你会发现压根就没人愿意买单。也有人尝试让ChatGPT给投资建议,基本上跟去赌场没什么区别。面对新事物,如果已经错过了信息套利的红利期,现在就不要想着怎么去捞偏财了。反而应该集中精力研究看看,怎么把生成式AI用在自己的主业里。所以今天我打算聊聊,怎么在投资分析使用ChatGPT等生成式AI。毕竟目前已经有很多镜像站(比如Poe之类的App),另外New Bing背后也是GPT-4,都是挺好的平替。
Part 1
🧮 一个有意思的案例 🧮
我还在麦肯锡做咨询时,面试小朋友时,经常会问他们市场规模测算的问题——比如让他们在无法访问网络的情况下,估算一下香港有多少个自助取款机,或者是估算一下上海每年能卖出多少杯咖啡。这种问题,一方面是考察逻辑分析能力,另一方面则是考察商业常识。然后某天,我心血来潮,让ChatGPT估算,北京市每年可以卖出多少平方米的地毯。有一点挺出乎我意料的:它可以意识到地毯满足的需求是以家庭为单位,而不是以个体为单位。所以它一开始就估算了北京的家庭数量,而不是按人口数量来进行估算。不过,它在估算过程中遗漏了对商用地毯的评估,于是我进一步对它进行提问。可以说,在市场规模测算这事上,ChatGPT已经不输那些到麦肯锡面试的应届生们了。如果可以接入实时数据库的话,甚至可以让它直接帮你把测算模型给搭好。所以当我完成了上述提问后,我就决定:以后所有的研究分析工作中,我都要尽可能地用上它。在这个过程中,我做了很多尝试,慢慢梳理了在各个研究环节中ChatGPT是如何发挥作用的。
Part 2
🔺 研究产出的成果 🔺
以投资研究为例,一般我们需要得出结论,判断某个股票或债券该不该买,或者说目前比较合适的资产配置应该是怎样的分布等等。结论需要有论述作为支撑,而论述又需要有事实的支撑。所以一般做研究,产出的成果,往往是一个结构稳固、逻辑自洽的「金字塔」——举个例子,我们在之前给大家聊到今年金价的走势时,就搭过一个金字塔——回顾我们的文章,你会发现长一点的文章,基本上都是这样的结构。每个金字塔都是非常稳固的结构:只要支持内容是事实,关键论述就会成立;只要关键论述都成立了,核心观点也大概率是靠谱的。
Part 3
🤖 利用AI构建金字塔 🤖
我们来看看,生成式AI在这两种构建金字塔的过程中,能怎么帮到我们。
方式1:自上而下
比如说2018年的时候,不少人观察到的「消费降级」现象(当时带火了涪陵榨菜、桃李面包等票)。敏锐的投资者会思考这个现象是否可以持续,所以找到消费降级背后的原因很重要。我们可以选择做一个非常详细的问卷,调查消费者生活方方面面的变化;也可以选择组织几场聚焦访谈,让消费者们畅所欲言;甚至可以选几个消费降级的人,(征得同意后)24小时观察他们的生活观察上几个月…另一个选择是,我们照着前面的「三部曲」,先第一步——做假设。通常要么是能力问题(真没钱了),要么是意愿问题(欲望少了)。我们可以开始思考:要论证消费者手上没钱了,我们可以在哪些方面找支撑?我们可以根据我们想要证明的论述,找到可以支撑的事实或数据。找到各个数据后,我们就可以证实或证伪一开始提出的假设了。在第一步的「做假设」阶段,比如我想研究碳酸锂的价格下跌的原因,它可以帮我发散思维,作出一些初步的合理解释。同样的问题我也抛给了百度的文心一言,不过有些假设并不是特别合理——而在第二步的「找支撑」阶段,生成式AI则可以帮我们建立分析框架——至于第三步「挖事实」,如果你没充值的话是用不上联网的ChatGPT的,这也意味着它只能访问2021年9月以前的数据。文心一言虽然可以联网,不过会有一些逻辑错误,需要我们仔细甄别……相比之下,New Bing会好用很多:因为它会列出数据来源,我们可以很快进行事实查证,看看它的回答是不是靠谱。另一方面,生成式AI还可以在这个步骤帮我们挖掘数据源(虽然部分网址有点问题)。
方式2:自下而上
我的朋友Xixi有个业务是放贷给地产公司,我以这个为背景,做了个案例。看完这封email,其实大部分人都没办法记得住什么——我就是罗列了一大堆事实,但是这些事实在罗列过程中并没有什么逻辑。而自下而上地去构建金字塔,就是要在一堆散乱的事实中去提炼一个核心观点。我们可以把email里头那些事实一个个写在便签纸上。其实就是做归纳总结,按某个合乎逻辑的标准,把同类项给归到一起,并提炼一下关键的论述。如果你比较熟悉会计的话,应该知道我们是按现金流的类型把问题进行了分类——分别对应融资现金流、投资现金流以及运营现金流。所以我们在进行第四步提炼核心观点的时候,也不难得出结论——按照上面的金字塔,我们可以把前面的email重新组织一下——你会发现整封email的逻辑变得特别清晰,你也更容易记住里头的关键信息点。而生成式AI,在前面的四个步骤里头,也可以很好地帮到我们。在第一步列发现阶段,你可以直接把内容丢给ChatGPT进行提炼。在第二步和第三步找规律+提要点,你会发现ChatGPT这方面的能力还是相对欠缺,它没办法对分类做到MECE(不重不漏)。比如前面的案例中,其实借款困难、上市失败、信任受损等结论,都可以算是财务状况的一部分。不过我也惊喜地发现,只要稍微给它一点提示,它也可以把任务完成得很好——而在最后一步提炼核心观点环节,ChatGPT的表现也是超出了我的预期——Anyway,至少从效率提升的角度来看,生成式AI确实有点用处。
Part 4
💀 GPT可以替代分析师吗 💀
从目前的技术水平来看,即使是行业领先的GPT-4模型,在做投资分析时,仍然存在着几个方面的挑战——挑战1:框架感不大好
比如前面提到的,在分类的时候,ChatGPT的框架还是没办法做到很MECE(不重不漏)。挑战2:时效性限制
即使目前GPT-4可以联网了,但也解决不了数据口径问题。比如中国有一个很重要的宏观经济数据——社会融资规模,它的口径隔三岔五就会改一次。如果你用2023年的数据跟2018年的数据做对比,口径都不一样,自然没办法得出有效的结论。挑战3:复杂口径
有些数据口径非常复杂,光是看字面意思都很难彻底搞懂。做分析的时候,很多时候会遇到只有业内比较资深的分析师才知道的细节。比如一季度的这两个数字,一个是10.6万亿,一个是10.7万亿。字面意思来看,后者是「对实体经济发放的人民币贷款」,那么人民币贷款除了给到实体经济,还能给到谁呢?其实会给到其他的金融机构,比如保险公司、证券公司等等。所以10.6万亿的那个数据,其实是更大的范围的口径,是银行发放给「实体经济+非银行类金融机构」的人民币贷款。但你会发现,这个口径的数值居然比发放给「实体经济」的那部分还要小0.1万亿。换句话说,一季度银行从非银行类金融机构手头上,还回收了0.1万亿。挑战4:提炼深度不够
我曾经让不少应届生对上面这三点进行提炼(你们也可以尝试下)。这个并不是一个有用的「提炼」,充其量只能算是「总结」。说得更直白一点,就只是做了小学生都能做到的「缩句」而已。而真正有意义的提炼,是光看那三句话没办法直接知道的,比如——而且我们可以通过不断问自己「So what」(那又怎样),推着自己去思考,从而得到更有深度、更能指导行动的提炼——但我试着提问了它们后,又发现好像它们比那些应届生的表现好得多……当然,包括前面提到的三个挑战,其实我们也可以通过不断喂它数据、训练它来进行修正。从这个角度来看,它已经可以完全替代掉初级的咨询顾问了。当然,它终究还是没办法彻底替代掉分析师们的。
P.S. 如果喜欢这类方法论文章,给我点动力,点个在看点个赞呗。「很帅的投资客」的所有内容皆仅以传递知识与金融教育为目的,不构成任何投资建议。一切请以最新文章为准。⚠️ 风险提示:OpenAI删账号;文心一言迭代速度不及预期。Icon/ freepik from flaticon主创/ 肖璟,@狐狸君raphael,曾供职于麦肯锡金融机构组,也在 Google 和 VC 打过杂。华尔街见闻、36氪、新浪财经、南方周末、Linkedin等媒体专栏作者,著有畅销书《风口上的猪》《无现金时代》。
文章引用微信公众号"很帅的投资客",如有侵权,请联系管理员删除!