我开始用AI来做投资分析了 | 方法论

新闻资讯 2023-06-06 20:34 99 0

（文末照例有一张图总结）

大家好，我是很帅的狐狸

今天我准备来聊聊

如何用生成式AI做研究

最近，我在网上刷了一堆「教你怎么用AI赚钱」的视频。

如果照着他们去做，比如去批量制作短视频什么的，或者批量出插画，最后你会发现压根就没人愿意买单。

也有人尝试让ChatGPT给投资建议，基本上跟去赌场没什么区别。

最后真正赚钱的，就只有那些教人用AI赚钱的。

面对新事物，如果已经错过了信息套利的红利期，现在就不要想着怎么去捞偏财了。

反而应该集中精力研究看看，怎么把生成式AI用在自己的主业里。

所以今天我打算聊聊，怎么在投资分析使用ChatGPT等生成式AI。

文章有点长，但干货很多，建议收藏分享。

顺带一提：本文不会分享如何用上ChatGPT。

毕竟目前已经有很多镜像站（比如Poe之类的App），另外New Bing背后也是GPT-4，都是挺好的平替。

稍微搜搜网上还是挺多教程的。

Part 1 🧮 一个有意思的案例 🧮

我还在麦肯锡做咨询时，面试小朋友时，经常会问他们市场规模测算的问题——

比如让他们在无法访问网络的情况下，估算一下香港有多少个自助取款机，或者是估算一下上海每年能卖出多少杯咖啡。

这种问题，一方面是考察逻辑分析能力，另一方面则是考察商业常识。

然后某天，我心血来潮，让ChatGPT估算，北京市每年可以卖出多少平方米的地毯。

它给了一个令我很满意的答案——

有一点挺出乎我意料的：它可以意识到地毯满足的需求是以家庭为单位，而不是以个体为单位。

所以它一开始就估算了北京的家庭数量，而不是按人口数量来进行估算。

不过，它在估算过程中遗漏了对商用地毯的评估，于是我进一步对它进行提问。

它也进行了补充——

可以说，在市场规模测算这事上，ChatGPT已经不输那些到麦肯锡面试的应届生们了。

如果可以接入实时数据库的话，甚至可以让它直接帮你把测算模型给搭好。

所以当我完成了上述提问后，我就决定：以后所有的研究分析工作中，我都要尽可能地用上它。

在这个过程中，我做了很多尝试，慢慢梳理了在各个研究环节中ChatGPT是如何发挥作用的。

Part 2 🔺 研究产出的成果 🔺

做研究，关键是要得出一个结论、一个观点。

以投资研究为例，一般我们需要得出结论，判断某个股票或债券该不该买，或者说目前比较合适的资产配置应该是怎样的分布等等。

结论需要有论述作为支撑，而论述又需要有事实的支撑。

所以一般做研究，产出的成果，往往是一个结构稳固、逻辑自洽的「金字塔」——

这个是《金字塔原理》一书所描述的。

举个例子，我们在之前给大家聊到今年金价的走势时，就搭过一个金字塔——

回顾我们的文章，你会发现长一点的文章，基本上都是这样的结构。

这种金字塔，就是我们做研究分析后的核心产物。

每个金字塔都是非常稳固的结构：只要支持内容是事实，关键论述就会成立；只要关键论述都成立了，核心观点也大概率是靠谱的。

那么问题就来了——

如何通过研究来构建金字塔呢？

一般有两种方式：自上而下，以及自下而上。

Part 3 🤖 利用AI构建金字塔 🤖

我们来看看，生成式AI在这两种构建金字塔的过程中，能怎么帮到我们。

方式1：自上而下

理工科出身的读者可能比较熟悉这个方式。

我们直接上一个栗子🌰——

比如说2018年的时候，不少人观察到的「消费降级」现象（当时带火了涪陵榨菜、桃李面包等票）。

敏锐的投资者会思考这个现象是否可以持续，所以找到消费降级背后的原因很重要。

我们可以选择做一个非常详细的问卷，调查消费者生活方方面面的变化；也可以选择组织几场聚焦访谈，让消费者们畅所欲言；甚至可以选几个消费降级的人，（征得同意后）24小时观察他们的生活观察上几个月…

另一个选择是，我们照着前面的「三部曲」，先第一步——做假设。

消费降级，本质上就是不花钱了。

通常要么是能力问题（真没钱了），要么是意愿问题（欲望少了）。

我们先假设主要是能力问题。

接着第二步——找支撑。

我们可以开始思考：要论证消费者手上没钱了，我们可以在哪些方面找支撑？

最后第三步是挖事实。

我们可以根据我们想要证明的论述，找到可以支撑的事实或数据。

找到各个数据后，我们就可以证实或证伪一开始提出的假设了。

而生成式AI，在这三个步骤中都可以帮到我们——

在第一步的「做假设」阶段，比如我想研究碳酸锂的价格下跌的原因，它可以帮我发散思维，作出一些初步的合理解释。

同样的问题我也抛给了百度的文心一言，不过有些假设并不是特别合理——

而在第二步的「找支撑」阶段，生成式AI则可以帮我们建立分析框架——

同样的问题我也抛给了文心一言——

至于第三步「挖事实」，如果你没充值的话是用不上联网的ChatGPT的，这也意味着它只能访问2021年9月以前的数据。

文心一言虽然可以联网，不过会有一些逻辑错误，需要我们仔细甄别……

相比之下，New Bing会好用很多：因为它会列出数据来源，我们可以很快进行事实查证，看看它的回答是不是靠谱。

另一方面，生成式AI还可以在这个步骤帮我们挖掘数据源（虽然部分网址有点问题）。

整体对效率还是有提高的。

接着我们来看看——

方式2：自下而上

同样的，我们直接上一个栗子🌰——

我的朋友Xixi有个业务是放贷给地产公司，我以这个为背景，做了个案例。

假设我给她写了这么一封email——

看完这封email，其实大部分人都没办法记得住什么——

我就是罗列了一大堆事实，但是这些事实在罗列过程中并没有什么逻辑。

而自下而上地去构建金字塔，就是要在一堆散乱的事实中去提炼一个核心观点。

首先是第一步，列发现。

我们可以把email里头那些事实一个个写在便签纸上。

接着是第二步和第三步，找规律+提要点。

其实就是做归纳总结，按某个合乎逻辑的标准，把同类项给归到一起，并提炼一下关键的论述。

比如前面的例子中，我们可以分成这三个关键论述——

如果你比较熟悉会计的话，应该知道我们是按现金流的类型把问题进行了分类——分别对应融资现金流、投资现金流以及运营现金流。

而这家公司三种类型的现金流都不大给力。

所以我们在进行第四步提炼核心观点的时候，也不难得出结论——

按照上面的金字塔，我们可以把前面的email重新组织一下——

你会发现整封email的逻辑变得特别清晰，你也更容易记住里头的关键信息点。

这就是金字塔的好处。

而生成式AI，在前面的四个步骤里头，也可以很好地帮到我们。

在第一步列发现阶段，你可以直接把内容丢给ChatGPT进行提炼。

这可能也是不少做投资研究的人的基本操作了——

在第二步和第三步找规律+提要点，你会发现ChatGPT这方面的能力还是相对欠缺，它没办法对分类做到MECE（不重不漏）。

比如前面的案例中，其实借款困难、上市失败、信任受损等结论，都可以算是财务状况的一部分。

不过我也惊喜地发现，只要稍微给它一点提示，它也可以把任务完成得很好——

相比之下，文心一言这方面的能力似乎还有待提高——

而在最后一步提炼核心观点环节，ChatGPT的表现也是超出了我的预期——

相比之下，文心一言对角色的判断还不是很准确。

Anyway，至少从效率提升的角度来看，生成式AI确实有点用处。

那么下一个问题就来了——

Part 4 💀 GPT可以替代分析师吗 💀

从目前的技术水平来看，即使是行业领先的GPT-4模型，在做投资分析时，仍然存在着几个方面的挑战——

挑战1：框架感不大好

比如前面提到的，在分类的时候，ChatGPT的框架还是没办法做到很MECE（不重不漏）。

挑战2：时效性限制

即使目前GPT-4可以联网了，但也解决不了数据口径问题。

比如中国有一个很重要的宏观经济数据——社会融资规模，它的口径隔三岔五就会改一次。

如果你用2023年的数据跟2018年的数据做对比，口径都不一样，自然没办法得出有效的结论。

而生成式AI在这方面的区分上暂时还存在挑战。

挑战3：复杂口径

有些数据口径非常复杂，光是看字面意思都很难彻底搞懂。

做分析的时候，很多时候会遇到只有业内比较资深的分析师才知道的细节。

比如央行每个月都会公布两个「人民币贷款」数据——

很多读者问过我这两个到底有什么区别，为啥对不上。

比如一季度的这两个数字，一个是10.6万亿，一个是10.7万亿。

字面意思来看，后者是「对实体经济发放的人民币贷款」，那么人民币贷款除了给到实体经济，还能给到谁呢？

其实会给到其他的金融机构，比如保险公司、证券公司等等。

所以10.6万亿的那个数据，其实是更大的范围的口径，是银行发放给「实体经济+非银行类金融机构」的人民币贷款。

但你会发现，这个口径的数值居然比发放给「实体经济」的那部分还要小0.1万亿。

其实这是因为，这个数据是「净增量」的概念——

换句话说，一季度银行从非银行类金融机构手头上，还回收了0.1万亿。

这种细节对于ChatGPT来说，也存在一定挑战。

挑战4：提炼深度不够

我们先来理解一下什么是「提炼深度」。

直接上一个栗子🌰——

比如现在有3个未经加工、未经排序的事实——

① 我把钥匙不知道放哪儿了

② 我以为护照在那儿，但没有

③ 我两个月没递交纳税申报表了

我曾经让不少应届生对上面这三点进行提炼（你们也可以尝试下）。

有不少人给到我的答案，是类似下面这样——

「我丢了钥匙和护照，而且我延误了报税」

这个并不是一个有用的「提炼」，充其量只能算是「总结」。

说得更直白一点，就只是做了小学生都能做到的「缩句」而已。

而真正有意义的提炼，是光看那三句话没办法直接知道的，比如——

「我最近什么事情都做不好」

而且我们可以通过不断问自己「So what」（那又怎样），推着自己去思考，从而得到更有深度、更能指导行动的提炼——

一开始，我觉得这个限制会是生成式AI最大的问题。

但我试着提问了它们后，又发现好像它们比那些应届生的表现好得多……

当然，包括前面提到的三个挑战，其实我们也可以通过不断喂它数据、训练它来进行修正。

从这个角度来看，它已经可以完全替代掉初级的咨询顾问了。

当然，它终究还是没办法彻底替代掉分析师们的。

毕竟报告还是需要人来签字，出了问题才有人来背锅。

而AI，暂时还没能力替我们去坐牢。

最后照例来个一张图总结——

P.S. 如果喜欢这类方法论文章，给我点动力，点个在看点个赞呗。

🤑

「Greed is good.」

「很帅的投资客」的所有内容皆仅以传递知识与金融教育为目的，不构成任何投资建议。一切请以最新文章为准。

⚠️ 风险提示：OpenAI删账号；文心一言迭代速度不及预期。

📖 相关阅读：

图文/ 狐狸

Icon/ freepik from flaticon

主创/ 肖璟，@狐狸君raphael，曾供职于麦肯锡金融机构组，也在 Google 和 VC 打过杂。华尔街见闻、36氪、新浪财经、南方周末、Linkedin等媒体专栏作者，著有畅销书《风口上的猪》《无现金时代》。

觉得对你有用的话，帮我点个在看吧 👇

文章引用微信公众号"很帅的投资客",如有侵权,请联系管理员删除!

[代售]动物园运动会，支付宝动物园运动会，游戏盘口源码

还是得锁定一下收益

博客评论

还没有人评论，赶紧抢个沙发~

发表评论

说明：请文明发言，共建和谐网络，您的个人信息不会被公开显示。

分类

菠菜源码（293）

棋牌源码（167）

网站源码（124）

网站模板（13）

新闻资讯（7945）