我开始用AI来做投资分析了 | 方法论

新闻资讯   2023-06-06 20:34   58   0  
(文末照例有一张图总结)
大家好,我是很帅的狐狸
今天我准备来聊聊

如何用生成式AI做研究


最近,我在网上刷了一堆「教你怎么用AI赚钱」的视频。
如果照着他们去做,比如去批量制作短视频什么的,或者批量出插画,最后你会发现压根就没人愿意买单。
也有人尝试让ChatGPT给投资建议,基本上跟去赌场没什么区别。
最后真正赚钱的,就只有那些教人用AI赚钱的。


面对新事物,如果已经错过了信息套利的红利期,现在就不要想着怎么去捞偏财了。
反而应该集中精力研究看看,怎么把生成式AI用在自己的主业里。
所以今天我打算聊聊,怎么在投资分析使用ChatGPT等生成式AI。

文章有点长,但干货很多,建议收藏分享。

顺带一提:本文不会分享如何用上ChatGPT。
毕竟目前已经有很多镜像站(比如Poe之类的App),另外New Bing背后也是GPT-4,都是挺好的平替。
稍微搜搜网上还是挺多教程的。


Part 1

🧮 一个有意思的案例 🧮


我还在麦肯锡做咨询时,面试小朋友时,经常会问他们市场规模测算的问题——
比如让他们在无法访问网络的情况下,估算一下香港有多少个自助取款机,或者是估算一下上海每年能卖出多少杯咖啡。
这种问题,一方面是考察逻辑分析能力,另一方面则是考察商业常识。


然后某天,我心血来潮,让ChatGPT估算,北京市每年可以卖出多少平方米的地毯。
它给了一个令我很满意的答案——


有一点挺出乎我意料的:它可以意识到地毯满足的需求是以家庭为单位,而不是以个体为单位。
所以它一开始就估算了北京的家庭数量,而不是按人口数量来进行估算。

不过,它在估算过程中遗漏了对商用地毯的评估,于是我进一步对它进行提问。
它也进行了补充——


可以说,在市场规模测算这事上,ChatGPT已经不输那些到麦肯锡面试的应届生们了。
如果可以接入实时数据库的话,甚至可以让它直接帮你把测算模型给搭好。
所以当我完成了上述提问后,我就决定:以后所有的研究分析工作中,我都要尽可能地用上它。
在这个过程中,我做了很多尝试,慢慢梳理了在各个研究环节中ChatGPT是如何发挥作用的。


Part 2

🔺 研究产出的成果 🔺


做研究,关键是要得出一个结论、一个观点
以投资研究为例,一般我们需要得出结论,判断某个股票或债券该不该买,或者说目前比较合适的资产配置应该是怎样的分布等等。

结论需要有论述作为支撑,而论述又需要有事实的支撑。
所以一般做研究,产出的成果,往往是一个结构稳固、逻辑自洽的「金字塔」——


这个是《金字塔原理》一书所描述的。

举个例子,我们在之前给大家聊到今年金价的走势时,就搭过一个金字塔——


回顾我们的文章,你会发现长一点的文章,基本上都是这样的结构。
这种金字塔,就是我们做研究分析后的核心产物。
每个金字塔都是非常稳固的结构:只要支持内容是事实,关键论述就会成立;只要关键论述都成立了,核心观点也大概率是靠谱的。

那么问题就来了——
如何通过研究来构建金字塔呢?
一般有两种方式:自上而下,以及自下而上


Part 3

🤖 利用AI构建金字塔 🤖


我们来看看,生成式AI在这两种构建金字塔的过程中,能怎么帮到我们。


方式1:自上而下



理工科出身的读者可能比较熟悉这个方式。

我们直接上一个栗子🌰——
比如说2018年的时候,不少人观察到的「消费降级」现象(当时带火了涪陵榨菜、桃李面包等票)。
敏锐的投资者会思考这个现象是否可以持续,所以找到消费降级背后的原因很重要。

我们可以选择做一个非常详细的问卷,调查消费者生活方方面面的变化;也可以选择组织几场聚焦访谈,让消费者们畅所欲言;甚至可以选几个消费降级的人,(征得同意后)24小时观察他们的生活观察上几个月…


另一个选择是,我们照着前面的「三部曲」,先第一步——做假设
消费降级,本质上就是不花钱了。
通常要么是能力问题(真没钱了),要么是意愿问题(欲望少了)。
我们先假设主要是能力问题

接着第二步——找支撑
我们可以开始思考:要论证消费者手上没钱了,我们可以在哪些方面找支撑?


最后第三步是挖事实
我们可以根据我们想要证明的论述,找到可以支撑的事实或数据。


找到各个数据后,我们就可以证实或证伪一开始提出的假设了。

而生成式AI,在这三个步骤中都可以帮到我们——
在第一步的「做假设」阶段,比如我想研究碳酸锂的价格下跌的原因,它可以帮我发散思维,作出一些初步的合理解释。


同样的问题我也抛给了百度的文心一言,不过有些假设并不是特别合理——


而在第二步的「找支撑」阶段,生成式AI则可以帮我们建立分析框架——


同样的问题我也抛给了文心一言——


至于第三步「挖事实」,如果你没充值的话是用不上联网的ChatGPT的,这也意味着它只能访问2021年9月以前的数据。


文心一言虽然可以联网,不过会有一些逻辑错误,需要我们仔细甄别……


相比之下,New Bing会好用很多:因为它会列出数据来源,我们可以很快进行事实查证,看看它的回答是不是靠谱。


另一方面,生成式AI还可以在这个步骤帮我们挖掘数据源(虽然部分网址有点问题)。


整体对效率还是有提高的。

接着我们来看看——


方式2:自下而上



同样的,我们直接上一个栗子🌰——
我的朋友Xixi有个业务是放贷给地产公司,我以这个为背景,做了个案例。
假设我给她写了这么一封email——


看完这封email,其实大部分人都没办法记得住什么——
我就是罗列了一大堆事实,但是这些事实在罗列过程中并没有什么逻辑。
而自下而上地去构建金字塔,就是要在一堆散乱的事实中去提炼一个核心观点。

首先是第一步,列发现
我们可以把email里头那些事实一个个写在便签纸上。


接着是第二步和第三步,找规律+提要点
其实就是做归纳总结,按某个合乎逻辑的标准,把同类项给归到一起,并提炼一下关键的论述。
比如前面的例子中,我们可以分成这三个关键论述——


如果你比较熟悉会计的话,应该知道我们是按现金流的类型把问题进行了分类——分别对应融资现金流投资现金流以及运营现金流
而这家公司三种类型的现金流都不大给力。

所以我们在进行第四步提炼核心观点的时候,也不难得出结论——


按照上面的金字塔,我们可以把前面的email重新组织一下——


你会发现整封email的逻辑变得特别清晰,你也更容易记住里头的关键信息点。
这就是金字塔的好处。

而生成式AI,在前面的四个步骤里头,也可以很好地帮到我们。

在第一步列发现阶段,你可以直接把内容丢给ChatGPT进行提炼。
这可能也是不少做投资研究的人的基本操作了——


在第二步和第三步找规律+提要点,你会发现ChatGPT这方面的能力还是相对欠缺,它没办法对分类做到MECE(不重不漏)。


比如前面的案例中,其实借款困难、上市失败、信任受损等结论,都可以算是财务状况的一部分。

不过我也惊喜地发现,只要稍微给它一点提示,它也可以把任务完成得很好——


相比之下,文心一言这方面的能力似乎还有待提高——


而在最后一步提炼核心观点环节,ChatGPT的表现也是超出了我的预期——


相比之下,文心一言对角色的判断还不是很准确。


Anyway,至少从效率提升的角度来看,生成式AI确实有点用处。

那么下一个问题就来了——


Part 4

💀 GPT可以替代分析师吗 💀


从目前的技术水平来看,即使是行业领先的GPT-4模型,在做投资分析时,仍然存在着几个方面的挑战——

挑战1:框架感不大好


比如前面提到的,在分类的时候,ChatGPT的框架还是没办法做到很MECE(不重不漏)。


挑战2:时效性限制


即使目前GPT-4可以联网了,但也解决不了数据口径问题。
比如中国有一个很重要的宏观经济数据——社会融资规模,它的口径隔三岔五就会改一次。


如果你用2023年的数据跟2018年的数据做对比,口径都不一样,自然没办法得出有效的结论。
而生成式AI在这方面的区分上暂时还存在挑战。

挑战3:复杂口径


有些数据口径非常复杂,光是看字面意思都很难彻底搞懂。
做分析的时候,很多时候会遇到只有业内比较资深的分析师才知道的细节。
比如央行每个月都会公布两个「人民币贷款」数据——


很多读者问过我这两个到底有什么区别,为啥对不上。
比如一季度的这两个数字,一个是10.6万亿,一个是10.7万亿。
字面意思来看,后者是「对实体经济发放的人民币贷款」,那么人民币贷款除了给到实体经济,还能给到谁呢?
其实会给到其他的金融机构,比如保险公司、证券公司等等。
所以10.6万亿的那个数据,其实是更大的范围的口径,是银行发放给「实体经济+非银行类金融机构」的人民币贷款。
但你会发现,这个口径的数值居然比发放给「实体经济」的那部分还要小0.1万亿。


其实这是因为,这个数据是「净增量」的概念——
换句话说,一季度银行从非银行类金融机构手头上,还回收了0.1万亿。
这种细节对于ChatGPT来说,也存在一定挑战。

挑战4:提炼深度不够


我们先来理解一下什么是「提炼深度」

直接上一个栗子🌰——
比如现在有3个未经加工、未经排序的事实——
① 我把钥匙不知道放哪儿了
② 我以为护照在那儿,但没有
③ 我两个月没递交纳税申报表了

我曾经让不少应届生对上面这三点进行提炼(你们也可以尝试下)。
有不少人给到我的答案,是类似下面这样——
「我丢了钥匙和护照,而且我延误了报税」

这个并不是一个有用的「提炼」,充其量只能算是「总结」
说得更直白一点,就只是做了小学生都能做到的「缩句」而已。

而真正有意义的提炼,是光看那三句话没办法直接知道的,比如——
「我最近什么事情都做不好」

而且我们可以通过不断问自己「So what」(那又怎样),推着自己去思考,从而得到更有深度、更能指导行动的提炼——


一开始,我觉得这个限制会是生成式AI最大的问题。
但我试着提问了它们后,又发现好像它们比那些应届生的表现好得多……


当然,包括前面提到的三个挑战,其实我们也可以通过不断喂它数据、训练它来进行修正。
从这个角度来看,它已经可以完全替代掉初级的咨询顾问了。

当然,它终究还是没办法彻底替代掉分析师们的。

毕竟报告还是需要人来签字,出了问题才有人来背锅。
而AI,暂时还没能力替我们去坐牢。

最后照例来个一张图总结——


P.S. 如果喜欢这类方法论文章,给我点动力,点个在看点个赞呗。
🤑
「Greed is good.」

「很帅的投资客」的所有内容皆仅以传递知识与金融教育为目的,不构成任何投资建议。一切请以最新文章为准。

⚠️ 风险提示:OpenAI删账号;文心一言迭代速度不及预期。
📖 相关阅读:

图文/ 狐狸
Icon/ freepik from flaticon
主创/ 肖璟,@狐狸君raphael,曾供职于麦肯锡金融机构组,也在 Google 和 VC 打过杂。华尔街见闻、36氪、新浪财经、南方周末、Linkedin等媒体专栏作者,著有畅销书《风口上的猪》《无现金时代》。
觉得对你有用的话,帮我点个在看吧 👇

文章引用微信公众号"很帅的投资客",如有侵权,请联系管理员删除!

博客评论
还没有人评论,赶紧抢个沙发~
发表评论
说明:请文明发言,共建和谐网络,您的个人信息不会被公开显示。