vibehacker.fm
Eng Cafe
October 1, 2023
中文
AIAIAI... GenAI 产品
程序员喝咖啡的时候都谈论些什么?聊聊GenAI产品的现状与趋势,从技术到产品的思考与实践。
Also on 小宇宙
0:00
0:00
1x
Transcript
Auto-scroll ON
0:00
大家好,欢迎来到新一期的安置咖啡,我是主播兴赶,今天又邀请了李全来跟我们聊一期最近的工作生活的更新,
0:13
What's new,然后再聊聊最近比较火的AI technology,那全来也给大家say hi。
0:20
大家好,我是李全来,可能我上一次来做播客可能是我们讲的那个财源,微股的财源的事情。
0:28
当时呢,我是幸运地躲不过了绕边户的财源,但是呢,俗话说,躲得过初一,躲不过十五啊。
0:37
我虽然并没有被绕边户的财源,但是我想着,我没有躲过绕边户的股价下跌,
0:43
所以我就开始自己创业了,因为绕边户的当时在我离职的时候,股价变成了原来的四分之一,
0:50
然后我觉得太低了,不如换个工作,然后换个什么好呢,我觉得自己创业挺好的。
0:57
所以我就自己创业了,我自己创业的东西可以等会儿再讲。
1:02
我们公司这个月初也第二波财源,我觉得还蛮惊讶的,也可以先聊一下财源这个话题。
1:09
我们公司去年十二月才一波,当时是财了百分之二十,然后这个月初财了百分之二十,可能百分之二十七的样子。
1:19
然后财完之后,两波加起来大概就百分之四十了,反正基本上财完之后,
1:25
financial metric会非常好看,但是就对材料的同事的感觉就比较人情寡薄一些。
1:35
不过我觉得现在我自己开始创业,也觉得创业公司的话,活下去也是第一位的,
1:42
可能在员工的角度看,人情很重要,如果是在公司的角度看,就是必须要先定流的冲突。
1:52
然后过去一两年,整体经济算是一个轻微的recession,
2:00
主要最重要的是interest rate不停地在涨,这对B2B、SaaS公司的打击还挺严重的。
2:09
然后主要像我们B2B、SaaS公司,因为我们的customer是别的公司,
2:14
然后别的公司他们会遭遇第一层的revenue减少、经济下滑,
2:19
然后这样子他们会缩减他们的开支。
2:22
可能以前每年他们有10 million software budget,
2:25
那今年从CFO角度就10 million一定要砍半,要5 million以下,
2:30
那很多software就开始compression。
2:33
像我们Growth还没有掉很多,所以还算比较好的,
2:38
因为Ltable也算是比较那种general purpose的software,
2:41
所以过去一年在B2B software领域就有那种compression,
2:46
意思就是以前我5个team用5个software,那现在5个team统一用1个software,
2:52
这样子我们不需要付5份seat的钱,就只要付1个seat就可以了。
2:57
所以有的公司是Ltable compress别人,有的公司是Ltable被别人compress,
3:02
这是一个很general的trend。
3:04
所以过去这一年,Enterprise、SaaS的Growth都有很大的打击,
3:10
valuation也都掉很多,
3:12
所以按照去年的Growth projection来算,
3:19
三年后的这些数据到今年全部不过2个,
3:23
所以才有这样子。
3:27
但在内部,可能是裁员之后伴随的比较大的reorg,
3:33
因为人少了之后有不同的structure,
3:37
有的org变成了pillar,
3:39
有的项目砍掉不做,
3:41
focus on更重要的东西,
3:43
Growth expectation更高的领域。
3:46
像我最近就是去了新的AI的一个pillar,
3:51
从零到一做我们的,
3:53
虽然之前也有,
3:55
但是还没有大规模的开始deploy,
3:57
那就是做一个比较新的产品线。
4:00
我之前是在Infra那边做,
4:02
但是现在就转到产品对我来说挑战还蛮大的,
4:06
因为有很多cross-functional work,
4:09
work with PM, work with designer,
4:11
然后像之前做CI和build system,
4:15
Infra比较熟悉,
4:17
但现在转到产品组,totally new tech stack,
4:20
所以有很多run pub的。
4:22
对我来说最exciting的还是,
4:25
因为我们现在做的这个产品线是一个新产品,
4:29
因为别的组做的feature都是,
4:31
我feature做出来了,
4:33
那可能improve overall,
4:35
altable, sell to customer,
4:39
但是我们组的产品可能是一个新的layer,
4:42
我们会在现有的customer,
4:45
不让他们付钱买AI seat,
4:48
来用我们这些feature,
4:50
同时我们这也是一个sales wedge,
4:52
sales wedge就是说算是一个talking point,
4:57
starter point,
4:58
oh do you want AI?
5:00
We have AI, let's talk.
5:02
So end up可能就customer并没有用AI feature,
5:06
可能是security concern,
5:07
可能他们没有这个需求,
5:09
但就start discussion,
5:11
然后sales就可以去把这个产品整个卖给他们,
5:14
也可以卖其他部分。
5:15
所以我感觉就整个business model方面了解这些东西,
5:19
然后跟着PM老板一起去跟enterprise customer聊天,
5:23
了解需求,
5:24
然后sell他们的product,
5:26
还是很有意思的,
5:27
跟之前做improve完全不一样。
5:29
那我其实很想了解一下,
5:31
就是你们如果做到SaaS的话,
5:33
它的主要的一些客户大概是什么样的人?
5:37
我不知道你有没有了解过altable相关的,
5:43
因为altable早期是PLG motion,
5:46
就product led growth,
5:48
这个term你了解吗?
5:50
对,这个我就知道了。
5:51
Ok,就altable它早期是走PLG路线,
5:54
然后它走的是比较那种hardcore的PLG,
5:57
因为很像很多vertical software,
6:02
就是说我解决这个行业的这个痛点,
6:05
你卖我的这个solution,
6:07
就exactly你解决你的这个问题,
6:09
但altable是这种platform,
6:11
legal kit,
6:13
你可以用altable来解决很多很多问题,
6:16
你可以DIY很多很多solution,
6:18
所以一开始卖这个东西很难,
6:20
但是把这个产品做得比较完善之后,
6:23
就会有很多bottom up这种,
6:27
就底层ICadopt这个产品,
6:30
然后在整个org开始用,
6:32
然后adjacent org会有不同的use case,
6:35
然后跟enterprise sales,
6:39
然后再reach out说,
6:40
你们不同组都用这个东西,
6:42
你们要不要upgrade到enterprise plan,
6:44
然后我们有SSO,
6:46
我们有enterprise security这些feature,
6:48
所以之前很多年一直走这个路线,
6:51
然后我们发展到一定程度之后,
6:55
我们就开始觉得就是self serve,
6:58
就是底层IC自己付钱,
7:01
然后一个CD一个CD用这个产品,
7:04
转到更sales lab growth,
7:08
就是sales直接去reach out CIO,
7:11
或者high level decision maker,
7:14
然后说你们org这些问题,
7:16
我们这个产品给你解决,
7:18
然后会从top down做这个decision,
7:21
说我们要买这个东西,
7:22
然后deploy到我们的org,
7:24
然后从这个function开始,
7:26
我们做一个解决方案用这个产品,
7:29
当这个function开始用我们这个产品之后,
7:32
我们可以再expand到别的function,
7:35
比如一开始我们给product function用,
7:39
然后之后我们可以发展到sales用,
7:41
之后可以再发展到HR用,
7:43
所以现在是走这个路线,
7:45
然后这个路线的话就更多的是会从enterprise customer的角度去做很多feature,
7:52
像enterprise feature跟consumer feature就会差很多,
7:58
因为enterprise你更着重scalability,
8:02
permission,security这些东西,
8:06
所以过去这一两年开始,
8:09
就公司更high level的strategy change,
8:13
就会更偏重enterprise,
8:15
所以这两次layoff基本上也是restructure the company,
8:19
让整个company可以更focus on enterprise growth这部分,
8:23
但是就self serve方面也不是说就不要了,
8:26
但就是说在一些resource allocation上,
8:31
做那些项目上可能就更有侧重了,
8:34
但是在说到AI feature,
8:36
就可能你我最近都开始更关注了吧,
8:40
我想先问一个问题,
8:44
就是你们的收入大概是一个什么结构,
8:48
就是有多少人会用enterprise的一个feature,
8:51
因为我觉得这个可能是对于你们做出这个决定是比较重要的一个信息,
8:57
做出决定你是说pivot to enterprise,
9:00
对,然后包括裁员,
9:02
是不是因为enterprise的收入远远大于个人的收入,
9:05
所以做出了这个决定?
9:07
就现在具体的revenue数字我肯定不能说,
9:11
但是就是说因为enterprise的,
9:14
一个是enterprise revenue的growth是高很多,
9:20
另外一个是enterprise revenue的potential对我们来说是更大的,
9:29
因为你想enterprise我们sales去聊完一个customer,
9:34
可能可以land 1 million deal,
9:36
然后这个1 million deal可能在未来几年可能会,
9:40
我们什么都不用做,
9:42
他们就变成了可能2 million,3 million的一个deal,
9:45
所以这个growth是会更efficient,
9:49
然后就整个dollar amount是更大,
9:52
所以对我们来说的话是就更attractive,
9:57
versus做consumer的话,
10:00
你很多,consumer怎么说就是你要做也可以做,
10:05
但是整个company的构成就完全不一样,
10:09
比如说research,
10:10
enterprise可能就是更这种user research,
10:14
你跟别人去one on one meeting,
10:16
去observe对方怎么用的,
10:18
但是consumer research,
10:20
像刚刚那种enterprise的research就是更qualitative research,
10:24
像consumer research可能就是跑ev testing,
10:27
更quantitative的research,
10:30
所以research org,
10:32
如果你focus on enterprise的话,
10:35
你可以把偏重consumer的那一部分research的IC给砍掉,
10:41
然后像design的话,
10:43
也是consumer的design decision,
10:46
enterprise的design decision也不一样,
10:48
像engineering的话,
10:49
很多enterprise的feature像privacy,
10:51
scaleability,
10:52
consumer完全用不到,
10:54
比如说你在node里面开一个database,
10:56
你可能100行最多了,
10:58
但是像l table的话,
11:00
在enterprise都是可能100k,500k行,
11:03
是一个no code database,
11:05
这就完全不是一个概念,
11:07
你要做的项目也是完全不一样,
11:09
所以如果你要focus on two things at the same time,
11:11
那可能就double your head count,
11:13
但是在现在的market condition下,
11:15
大家要efficient growth,
11:17
1000个employee,
11:18
你的growth数据就很难看,
11:21
但如果你砍了500个人的话,
11:23
你的growth数据就会好看很多,
11:25
那在这种情况下,
11:27
你要make decision,
11:28
就是你要砍哪些项目,
11:30
砍完这些项目,
11:31
你的cost达到这个数字了,
11:34
然后你的growth,
11:36
如果你能focus on这一个方面的growth,
11:39
然后之后就是growth和你的cash flow,
11:42
这两个加起来是叫一个rule of 40,
11:45
所以这个数字如果大家看到这个数字的话,
11:48
rule of 40就是你的growth rate,
11:53
let's say我们现在的growth rate如果是50%,
11:58
然后如果我们的cash flow rate是亏20%,
12:03
那50-20就是30,
12:06
我们rule of 40就是30的这个数字,
12:09
就是低于40的,
12:10
40就是现在industry的一个rule of sum,
12:14
一个公司,
12:15
如果你是efficient growth,
12:17
那你这两个数字加起来或者减下去,
12:20
就是在40G以上,
12:22
如果你在40以下的话,
12:24
either你的growth rate不行,
12:26
要么就是你的cash flow,
12:28
你的burn太多了,
12:30
所以你可以想象,
12:32
一个是你growth要高,
12:33
那我们目前看到是enterprise的growth比consumer要高,
12:37
所以我们会prefer enterprise,
12:39
另外一个是我们要cut cost,
12:41
cut cost就是我们要cash flow positive,
12:43
我们每年不能亏钱,
12:45
我们要盈利,
12:46
这一个是你的growth,
12:48
在你的revenue growth要到达一定程度,
12:52
另外一个就是你的人不能太多,
12:55
因为salary还是最大的一个支付,
12:59
相比于我们infrastructure和其他的一些支付的话,
13:03
付给大家的工资还是最多的,
13:05
所以你要从1000个人要看到500个人,
13:09
600个人,
13:10
所以你又要砍人,
13:12
又要保证你的growth的话,
13:14
那就是回到我们刚刚说的,
13:16
你是砍掉consumer的project,
13:18
还是砍掉enterprise的project,
13:20
所以从这个经济和how company works的logic上来说的话,
13:26
我觉得裁员还是make sense,
13:28
但是真正开始落实,
13:30
作为我们底层的on the ground,
13:32
front line,IC的话,
13:34
看到什么隔壁组被砍了,
13:36
或者我们组的这个人那个人被裁员了,
13:40
还是挺难过的,
13:41
我下周周末还跟我们有一些前同事,
13:45
现同事还要出去吃个饭,
13:48
聊天啥的,
13:49
大家还蛮期待的,
13:51
对,
13:52
对,
13:53
但是我也说愿意,
13:54
他们可以找到比较不错的工作,
13:56
其实,
13:57
对,
13:58
找工作的话,
14:00
这我也不知道现在的market怎么样,
14:03
现在应该不是很好,
14:04
现在应该不太好找,
14:05
我们最近有一些job posting,
14:07
也是突然就多了很多人来apply,
14:09
但是我们因为我们的budget有限,
14:12
所以我们其实可能就会什么,
14:15
所以不一定会找这些人,
14:17
嗯,
14:18
你们公司的budget的finance这些,
14:21
你能你能讲吗,
14:23
还是这些,
14:24
就是我基本上都是在国内招人,
14:26
如果国内招人的话可以每个月,
14:28
也就是基本上给几千美元,
14:31
那么这个肯定是和美国的这个,
14:34
呃,
14:35
和美国的这个level是不一样的,
14:37
嗯,
14:38
但几千美元对国内来说的话,
14:40
算是一个比较OK的一个level吗,
14:43
嗯,
14:44
对国内来说对还算OK,
14:46
呃,
14:47
但是因为因为因为国内最近也有很多人,
14:50
所以所以这个对国内来说比较OK,
14:52
呃,
14:53
I see,
14:54
但但你就是,
14:55
但你的remote而且有时差的话,
14:57
你在做项目上会,
14:59
对,
15:00
不方便,
15:01
呃,
15:02
那那肯定有不方便,
15:03
但是这个不方便肯定还是可以被这个,
15:06
呃,
15:07
就你哪怕三四千块钱,
15:09
你招两个,
15:10
可能也要比在美国找,
15:12
就是找一个,
15:13
然后没有时差了,
15:14
好,
15:15
make sense,
15:16
make sense,
15:17
嗯,
15:18
嗯,
15:19
你们公司最近咋样,
15:20
来,
15:21
对,
15:22
我可以简单的讲一下我们,
15:23
我我我做的做的东西,
15:24
呃,
15:25
是这样的,
15:26
呃,
15:27
呃,
15:28
在今年的五月的时候,
15:29
呃,
15:30
今年四月的时候离开了,
15:31
然后在五月的时候开始做了我的新的项目,
15:34
Dr.
15:35
Lambda的主要的功能,
15:37
就是说可以上传文件,
15:39
然后帮助大家去把这些文件转换成,
15:43
呃,
15:44
然后大家也可以去修改,
15:45
分享这些,
15:46
呃,
15:47
那么Dr.
15:48
Lambda如果大家想用用的话,
15:50
可以来这个,
15:51
呃,
15:52
我们的网站,
15:53
呃,
15:54
Lambda.ai这个网站来使用,
15:58
呃,
15:59
除此以外,
16:00
就是说,
16:01
呃,
16:02
我们是九月初推出了这个产品,
16:05
就是在,
16:06
呃,
16:07
当天拿到了,
16:08
呃,
16:09
第三名,
16:10
呃,
16:11
就是我没有做任何的付费推广,
16:13
拿到第三名,
16:14
呃,
16:15
然后之后我们又去做了这个,
16:17
呃,
16:18
我们之后又开开通了付费的这个功能,
16:21
是上有开通的,
16:22
呃,
16:23
现在已经有了付费的用户,
16:24
所以总体来说,
16:25
呃,
16:26
发展还是不错的,
16:27
呃,
16:28
那么我觉得我们现在想要就是,
16:30
呃,
16:31
做的一个东西,
16:32
就是说我们希望把这个东西,
16:34
呃,
16:35
推广出去做一个更大的推广,
16:37
呃,
16:38
比如说是,
16:39
呃,
16:40
一方面是推给更多的人,
16:41
呃,
16:42
另一方面也是获得更多的这个付费用户,
16:44
呃,
16:45
这样子,
16:46
然后所以如果大家愿意呃,
16:47
体验一下的话,
16:48
欢迎大家来这里体验,
16:49
然后,
16:50
呃,
16:51
就像刚才说的,
16:52
呃,
16:53
我们也想做这个东西,
16:54
因为我们觉得这个东西能是最适合我们的一个办法,
16:57
呃,
16:58
因为我们想要就是低成本的去,
17:00
呃,
17:01
增长,
17:02
比如说增加我们的用户到,
17:03
呃,
17:04
到这个,
17:05
呃,
17:06
10万或者是10万个用户左右,
17:08
嗯,
17:09
你们的product大概是帮助大家做slides,
17:13
写论文,
17:14
对的,
17:15
content generation,
17:16
对的,
17:17
你,
17:18
你是针对哪一些用户群,
17:20
或者在哪一个vertical领域,
17:22
主要是研究人呃,
17:23
研究人员,
17:24
他们就要有些比较service的研究的东西,
17:27
呃,
17:28
我们知道可能呃,
17:29
有一些新的AI产品,
17:30
比如说,
17:31
他们的主打的功能是,
17:33
呃,
17:34
help people to generate slides based on their ideas,
17:37
但是idea可能一句话就可以说完,
17:39
但如果我要说,
17:40
generate some slides based on your knowledge and information,
17:43
这个东西,
17:44
它不是一个一句话可以说完的东西,
17:46
它是一个structured information,
17:49
在这种情况下,
17:50
你就不能只是通过prompt去生成,
17:52
而是需要通过文字去生成,
17:54
这就是我们做的,
17:55
嗯,
17:56
所以你需要,
17:57
let's say我是一个researcher,
17:59
我在用你们的产品,
18:00
我需要自己先写呃,
18:02
写一些大概raw notes for paper,
18:05
然后你会帮我生成一个paper或者presentation吗?
18:09
呃,
18:10
生成slides,
18:11
呃,
18:12
生成slides,
18:13
对,
18:14
但是呃,
18:15
我们主要是就是说,
18:16
你有这个paper本身,
18:18
然后再加上raw notes,
18:19
生成效果会比较好,
18:20
而这个功能,
18:21
呃,
18:22
现在没有别的,
18:23
呃,
18:24
产品在做,
18:25
呃,
18:26
我有两个问题,
18:27
一个就是像researcher,
18:29
他们会有多少,
18:31
或者多频繁的需求要做presentation,
18:35
或者,
18:36
呃,
18:37
其他呃,
18:38
那么对有些researcher来说,
18:40
他们还是比较经常去做presentation,
18:42
呃,
18:43
我可以举一个例子,
18:44
就是我们的一个付费用户啊,
18:46
他是一个某个研究机构的一个研究员,
18:49
呃,
18:50
而且他是中欧的一个人,
18:53
和我们完全没有任何关系,
18:55
是我们发布以后,
18:56
然后自然流量找到的,
18:58
所以我觉得这个人可能比较代表性,
19:01
呃,
19:02
我找到他在哪,
19:03
那么我看一下啊,
19:05
他,
19:06
对,
19:07
他是一个,
19:08
呃,
19:09
他是一个研究political scientist,
19:11
然后呢,
19:12
他现在在他现在的工作是,
19:15
呃,
19:16
提升他们,
19:17
呃,
19:18
他们自己国家的一个,
19:19
呃,
19:20
国际经营力,
19:21
呃,
19:22
然后他要发表这个学术文章,
19:24
呃,
19:25
然后研究这个不同国家的这个,
19:28
呃,
19:29
而且就是提升这个生活质量,
19:32
那么他就给我们的这个产品付费了,
19:35
所以我觉得,
19:36
呃,
19:37
这个也是我们自己认为的一个比较典型的一个,
19:40
呃,
19:41
你们现在还是就是让individual去买你们的付费,
19:46
你们的产品,
19:47
呃,
19:48
你有想过和一些这一些university的institution,
19:53
直接让给他们那里所有的researcher去按c的收费吗?
19:58
他说这些跟enterprise和teams feature,
20:02
你们现在还没有prioritize,
20:04
呃,
20:05
我,
20:06
我们,
20:07
我们现在没有prioritize,
20:08
但是我觉得是一个将来需要做一个,
20:11
呃,
20:12
比较重要的一个东西,
20:13
呃,
20:14
因为,
20:15
呃,
20:16
enterprise现在的一个情况,
20:17
就说我们的产品可能还没有做到enterprise可以用的地步,
20:20
呃,
20:21
然后我们可能之后逐步会加进来,
20:23
然后像你说的,
20:24
就是,
20:25
可能开始也是prototype growth,
20:27
就先是给一部分的去用,
20:29
然后给一些teams去用,
20:30
然后给一个整个organization去用,
20:32
我们也想走这个,
20:33
这个思路,
20:34
对,
20:35
make sense,
20:36
因为那先把产品做到,
20:38
呃,
20:39
产品本身的feature做到足够好,
20:41
然后再去做一些方便团队和enterprise,
20:45
adopt这些feature,
20:47
所以一般是,
20:48
嗯,
20:49
很多公司都是这样的一个路线,
20:51
哦,
20:52
我还还有一个问题是你刚刚说的,
20:54
就是,
20:55
呃,
20:56
对于一个researcher,
20:57
他有一些structure的一些nodes或者paper,
20:59
你可以帮助他来更好的生成presentation,
21:02
但你们的产品会帮助我来,
21:05
呃,
21:06
clarify我的thought process,
21:08
写我的raw nodes,
21:10
呃,
21:11
前面的这一个过程,
21:12
这个我们的不是我们的主要的功能,
21:15
因为因为对我们来说就是,
21:17
呃,
21:18
我们必须要有一个比较清晰的输入,
21:20
才可以做成比较好的,
21:22
质量高的,
21:23
比较呃,
21:24
高的,
21:25
如果就是说如果我们所有东西都帮帮人做了,
21:28
也可以,
21:29
但是这样的东西,
21:30
它的质量其实不会,
21:32
它和别人的AI产品是不会有太大的区别的,
21:35
就比如说我想说一个啊,
21:37
给我设计一个,
21:38
比如说装修方案,
21:39
那么那么你用别的产品和用我们的产品,
21:42
可能做出来的效果都是差不多的,
21:44
因为直接连的基本上都是大于原模型,
21:46
呃,
21:47
但是我们的好,
21:48
就是说如果你已经有一个document了,
21:50
这个document是你的装修方案,
21:52
然后想把它做成style,
21:53
这个就是我们的呃,
21:54
优势的地方,
21:55
那你们现在是相当于做一个web based的一个application吗?
22:00
还是呃,
22:01
我们现在是web application,
22:03
你有考虑什么?
22:05
做成一个ppt或者keynote的一个extension之类的,
22:09
我不知道啊,
22:11
这个有些别的产品在做,
22:13
但是我们不太往这个方向走,
22:15
因为第一是,
22:16
呃,
22:17
其实并没有那么多人,
22:19
并没有那么多人使用keynote或者ppt,
22:22
呃,
22:23
我们也许会做一个chrome extension,
22:25
呃,
22:26
然后第二就是说,
22:27
我觉得,
22:28
呃,
22:29
比较重要的是我们自己要掌握这个数据,
22:31
而不是把这个数据交给别人,
22:33
所以我们会把东西放在我们自己的平台上,
22:36
而且你看,
22:37
22:37
一些新兴的产品,
22:38
比如说chrome,
22:39
他们都没有把自己转换成ppt或者是keynote,
22:42
所以我觉得这个东西我们自己也可以做,
22:45
但是,
22:46
呃,
22:47
像如果我用你们产品,
22:49
你的意思是你会采集我putting,
22:52
我写进去的数据,
22:53
然后生成怎么样的slides,
22:55
我会比较满意,
22:56
但这样会,
22:57
尤其是这个最后的slide的这一步,
23:00
呃,
23:01
但,
23:02
呃,
23:03
你是说就如果这个slide,
23:04
比如免费用户做出来的slide是public,
23:09
然后这部分数据你会collect,
23:12
但如果是付费用户,你就不会采取这个数据。
23:15
首先就是所有的用户的slide,
23:17
如果他们不去决定类型都不会是public的,
23:20
但是我们会根据他们的一些和我们的interaction来找用。
23:26
OK,所以主要是interaction那部分,
23:29
而不是说我的那些text可能会有更改。
23:33
对,有时候生成的内容我们也会检查,
23:36
就是说看看这个东西的质量到底是不是过关。
23:40
对,因为对我们来说的话,
23:43
数据采集是一个比较头痛或者甚至敏感的一个问题,
23:48
因为ltable存的是用户的他们的数据,
23:52
所以这部分数据我们是绝对不可以拿来train model之类的,
23:57
所以我们就并没有一个像notion之类的,
24:01
他们这些也都一样,
24:03
因为存的都是用户自己的数据,
24:05
所以你可以去调AI model,
24:08
但是你不可以把这些数据中间拦截下来,
24:12
然后你offline拿去做training或者是fine tuning,
24:15
以后可能会出product,
24:17
就是说用户mark一些data set的时候,
24:20
我要拿这些data set的,你来帮我做fine tuning,
24:23
或者你来帮我做一个training model,
24:26
这些可能是可以的,
24:28
但是我们不可以就采集很多用户来做成一个ltable,
24:33
GBT,whatever的一个新的model,
24:36
像一些更大更有钱的公司,
24:39
像Salesforce做了他们,
24:41
好像叫Einstein吧,
24:43
做了他们自己的vertical specific的一个model,
24:47
像Bloomberg做了他们自己的model,
24:49
像Adobe做了image generation,
24:52
甚至不需要考虑版权问题,
24:54
但对我们现在的scale来说,
24:57
还是没有办法去采集那么多我们有知识产权的主席。
25:03
I see,
25:05
所以我觉得这个可能是在你们user agreement里面,
25:08
尤其是enterprise的user,
25:10
是对这个比较重要的。
25:12
Right,
25:13
然后另外也是对我们来说,
25:17
现在还是figure out哪些feature是更有价值的,
25:23
所以我们现在的想法就是,
25:25
先build足够有价值的feature,
25:29
然后我们可能会遇到的问题是,
25:32
我们被我们的model provider rate limit了,
25:36
那我们可能会尝试multi-model,
25:39
然后来做这种load balance,
25:43
between different model,
25:45
如果我们的accuracy被,
25:47
用户如果会feedback说,
25:49
你这个modelaccuracy不行,
25:51
跑这些task可能一半时候都是错的,
25:55
那我们可能会去看看,
25:57
怎么去提高这些accuracy,
25:59
然后如果也有可能是,
26:01
比如说GPT-4太慢了,
26:03
那我们可能会想,
26:04
我们怎么能fine tune GPT-3.5,
26:06
然后用更快的速度可以跑一样的功能,
26:10
所以就这些accuracy和cost performance,
26:15
像这些东西,
26:17
我们现在是sequence在feature set之后,
26:20
到那部分,
26:22
到那部分的时候,
26:23
我们可能会再去看,
26:24
要不要做新的model,
26:26
fine tuning这一些。
26:28
对,
26:29
所以就是我觉得其实,
26:33
这个东西是一个非常需要消耗的成本的东西,
26:37
所以我觉得适合大一点的公司去做,
26:40
如果是稍微小一点的公司,
26:42
我觉得把精力花在fine tuning上面,
26:44
可能是都不成事的,
26:46
因为一方面数据有限,
26:48
另一方面人力有限,
26:50
所以我觉得可能更适合先做产品,
26:53
然后有一定的用户来再做fine tuning。
26:57
其实我也不知道,
26:59
现在到底有多少人在用AI product,
27:03
因为我觉得enterprise,
27:05
大家都nobody know how to use this thing,
27:09
会有一些customer,
27:10
他们有一些idea,
27:11
说可能AI可以拿来做这些事情,
27:14
我们来试试看,
27:15
可能都是这种stage,
27:17
就很少说有一个killer feature,
27:21
就是AI based feature,
27:24
然后大家都shut down,
27:26
take my money,
27:27
那样的来。
27:29
然后这个consumer中,
27:31
我在推特上看的也是open secret,
27:33
就是term基本上是30%+,
27:36
我不知道你们公司的term是怎么样的,
27:38
就是很多用户都是try it out,
27:40
我们现在还没有到可以查到这个,
27:42
我们现在基本上都是刚第一个月使用,
27:50
还不知道这个数据。
27:52
我会expect付费一个月之后,
27:56
第二个月很可能就不付费了,
27:58
这样的情况会有很多。
28:00
所以consumer的领域称很高,
28:04
unpredictable,
28:05
enterprise的领域的数据非常的不透明,
28:12
但是因为我在这方面做,
28:15
我能观察很多,
28:17
包括其他公司一些,
28:19
我觉得很多deal还是很难去land,
28:23
因为use case都不是很明确,
28:25
value prop都不是很强,
28:27
所以在你的product都还没有做出来的情况下,
28:31
如果你去做cost improvement,
28:34
去做performance improvement,
28:36
我觉得很难去justify,
28:38
但可能有的公司的enterprise AI product,
28:41
做得非常非常好,
28:42
他们需要去做这些,
28:44
我觉得对我来说会非常有意思,
28:46
会很想去了解一下。
28:49
话说下个月有两个conference,
28:52
我可能要去,
28:54
一个是AI Engineer Summit,
28:56
另外一个是OpenAI的Dev Day,
28:58
所以我觉得到时候可能会。
29:00
Dev Day我没有收到邀请,
29:02
但是我很想去的,
29:03
我不知道这个东西可以怎么样加入吗?
29:07
我sign up,
29:08
然后我是昨天收到邀请了,
29:10
所以我可能下周一
29:12
问一下老板expense的问题吧,
29:14
但如果不expense,
29:16
我可能也就自己付钱去,
29:18
我估计应该是,
29:19
先说是会expense,
29:21
另外一个,
29:24
registration is now closed,
29:26
哎呀,好惨。
29:27
你如果现在还没有报名的话,
29:29
可能是除非你拼OpenAI的人,
29:32
我是之前报名了,
29:33
他们好像会有一个list,
29:36
那我拼一下。
29:38
你们新产品的话,
29:40
你觉得用哪些AI technology,
29:43
你觉得比较有意思?
29:44
其实说实话,
29:46
我们这一波,
29:47
从去年到今年,
29:48
这一波的AI的东西,
29:50
基本上都生成AI,
29:51
那么生成AI的话,
29:53
基本上就是LLM和Diffusion Model,
29:55
那么一个生成图像,
29:57
当然Diffusion现在也可以去生成视频,
30:02
然后另一个就是文字类的,
30:04
文字类的主要就是说LLM,
30:06
然后它的功能就是你可以去summarize,
30:10
然后可以去总结,
30:11
然后可以去有应用的逻辑推理能力,
30:13
我们基本上就是用的是summarize总结,
30:16
然后生成内容的这一块的能力,
30:18
然后而且还可以把一段话转换,
30:22
比如说转换一下它的风格之类的,
30:25
然后这个东西,
30:26
其实我觉得效果还是不错的,
30:28
我们也是主要用这个,
30:30
而且我觉得像你刚才说的,
30:32
可能不知道有多少人去用AI的产品,
30:35
我的想法是这样,
30:36
就是说很多人他用一个产品,
30:38
不是说因为这个产品是AI,
30:40
而是说这个产品解决了他的痛点,
30:42
那么比如说很简单的一个例子,
30:45
就是大家可能都会用CAPTCHA,
30:47
对吧,
30:48
那所有人基本上都用过这个东西,
30:50
那么这个东西其实它就是一个AI产品,
30:52
只不过可能很多人没有意识到它是AI产品,
30:55
所以我觉得可能比较好的一个AI产品,
30:58
应该就是这样的,
31:00
它是一个,
31:01
不会让你特别注意到它是一个AI产品,
31:04
你只会觉得它很好用,
31:06
然后这个AI的属性应该是附着在产品上面的,
31:10
所以我觉得其实最重要的是要讲,
31:13
有哪些场景是可以用AI,
31:15
或者说有哪些场景需要去解决,
31:17
然后可以用到AI,
31:18
而不是说我先找到一个AI的技术,
31:20
然后再把它去看场景,
31:23
除非是你是一个OpenAI这样的一个特别厉害的一个大公司,
31:28
你可以去做那种特别占用的东西,
31:30
我觉得否则对于一些稍微小一点的公司,
31:33
不一定需要做特别占用的一个AI的产品,
31:37
而是要做一个更贴近用户实际需求的,
31:42
更接地气一点的这种AI产品。
31:44
我觉得这里是一个Infralayer和Applicationlayer,
31:49
Applicationlayer你的Innovation并不是,
31:52
你的Innovation并不是Infrastructure Innovation,
31:57
像做Application你不是说我要Innovate a new model,
32:01
你做的更多的是Product Innovation,
32:04
你怎样去更好地解决用户的一些Problem,
32:08
所以我也想起来就看了非常多的Steve Jobs的一个视频,
32:13
就是You can't go from technology to a problem,
32:18
you need to start from the problem of the customer,
32:23
and then come back to what technology you need to build,
32:27
我觉得对Infra公司来说,
32:29
他们的Customer就是Application Developer,
32:32
所以他们要解决的Customer Problem就是,
32:35
我们Application要有非常Intelligent的一个Generated Content,
32:41
或者是Query Structured Tabular Data,
32:45
然后他们能做出一个LLM,
32:48
然后能10X Better来解决这些问题,
32:51
就是不同的Customer,
32:54
不同的Layer,
32:56
会在不同的地方有Innovation,
33:00
除了就是做GenEI来做Content Summary和Generation,
33:09
你觉得在Integrate Slides和Raw Content,
33:16
和如何让Human在整个过程中Get Involved,
33:23
Stay In Command,
33:25
在这方面你觉得用这些东西,
33:28
可能之前网上没有读到的,
33:31
或者是踩了很多坑,
33:33
才Figure out一个比较好的解决方案,
33:36
我觉得这个东西其实很难去讲,
33:38
因为说实话OpenAI的模型也是一直在变的,
33:41
我们其实一直用的CPT3的话,
33:43
你会发现同样一个Bump,
33:45
今年3月和今年4月到现在,
33:47
可能出来的结果是不一样的,
33:49
所以有的东西当时可能效果还不错,
33:52
现在效果就不好了,
33:53
或者说有的东西当时效果好,
33:55
现在就不好了,
33:56
基本上都是Bump and Generation的一个东西。
33:59
我的意思是因为像LLM Text In Text Out,
34:05
不过我们说下个月之后GPT-4 Vision KPI发布,
34:09
可能是Image In Text Out,
34:12
但就现在Text In Text Out的话,
34:14
你是怎么Integrate到Slides的Generation?
34:17
我觉得是这样的,
34:19
首先你会把Slides拆解,
34:22
Slides的道理是什么?
34:24
首先你可以先把它的Slides拆成一页一页的东西,
34:27
然后你可以把它拆开成,
34:30
比如说把每页拆开成一个图片或者文字,
34:34
然后这样子你可以把文字生成的工作
34:37
交给比如说Slides去解决,
34:41
然后如果你是有图片的功能,
34:45
可能就交给比如说Efficient Model,
34:49
甚至你可以网上去搜索去解决,
34:51
这些都是我们可能可以考虑的一些思路,
34:55
还有就是说你可能整个Slides会有一个大纲,
34:59
那么你的大纲可能又可以由LLM来生成,
35:03
所以这些都是AI帮助到生成的部分。
35:07
OK,那这个Format这一部分是你们Proprietary的一个解决方案,
35:14
还是Open Source会有一些Library来Support?
35:17
这个目前是Proprietary的一个解决方案,
35:21
不过其实你去看其他的东西,
35:24
他们做的可能都是大同小异,
35:27
其他的一些性不性能。
35:29
OK,Interesting,
35:31
你们会用到一些更Agent Style的一些东西吗?
35:37
比如说我给一个Research Direction,
35:40
然后Agent Go Out,
35:42
Do Some Google Search,
35:44
Do Some Thinking。
35:45
这个是我们将来会加入的一些功能,
35:48
因为我们将来就是想去做Agent,
35:52
但这个Agent现在有一个问题就是
35:54
它的质量不会特别的好,
35:56
所以Agent尤其是,
35:58
如果你让它做一两步,
36:00
它可以比较中程的完成你的任务,
36:02
如果你要做很多步的话,
36:05
它就不能中时的完成任务了,
36:08
所以如果是这样子的话,
36:09
那我们肯定也要调整,
36:11
但我们可能事后还是把它做成一两步的呢。
36:14
你觉得主要是Model Quality的问题,
36:19
还是在咱们Application Developer层
36:23
怎样把Knowledge Base和一些Human Feedback给它串起来,
36:29
导致它Agent的能力不行,
36:32
还是更整体的?
36:34
我觉得是有这么几个因素,
36:36
第一就是Agent它其实有几个,
36:39
比如说有一些Function,
36:40
那么这些Function可能是,
36:42
比如说你第一次去跑它的时候,
36:45
它可以做上网搜索,
36:47
它可以做总结之类的,
36:49
但是你做了很多次以后,
36:51
它的这个功能就和你原来的意思是有相悖的,
36:55
或者说偏离了原来的意思,
36:57
在这种情况下,
36:58
AI Agent的这个功能,
37:00
其实它可以上网搜索,
37:02
但它已经记不起来你到底让它干什么了,
37:05
然后我觉得这是一个比较大的问题,
37:08
然后AI Agent有很多人也讨论过其他的一些问题,
37:12
比如说它非常的费钱,
37:14
因为它要有很多GDP靠,
37:17
这个可能也是一个比较现实的一个问题,
37:19
所以总体来说就是,
37:21
而且我们要做的东西其实没有那么Open,
37:24
就是我们做的那个东西没有那么Open Ended,
37:28
我们就是要做一个Slide,
37:29
那么你当然比如说我第一次试用一个AI Agent的时候,
37:33
我让它给我赚钱,
37:34
然后它算了一天晚上,
37:36
它没算出来怎么给我赚钱,
37:38
那么实际上如果我们做Slide的话,
37:42
根本不需要它算那么多步,
37:44
可能就算比如说两三步,
37:46
比如说它在网上搜索材料,
37:48
总结就可以了,
37:50
不需要它搜索材料,
37:51
然后总结再次搜索材料,
37:52
如果这样子的话,
37:53
基本上就是不一定会有更好的效果。
37:58
那对于未来的一些更Low Level AI Technology,
38:06
你对哪些会比较期待,
38:08
可以帮助你们产品做得更好?
38:11
这个东西我觉得首先是阅读,
38:17
可能你之前也聊过,
38:18
就是说如何去读取Structure的Data,
38:21
尤其是一个图表,
38:23
这些东西如何去读取,
38:25
如果这个能读取的话,
38:26
效果我觉得会不错。
38:28
你查GPT有GPT4 Vision的Access吗?
38:33
据说是可以把Chart和Image放进去,
38:36
然后它可以Understand,
38:38
在Image里面是怎样一个Structure和它的Meaning。
38:41
对,我好像还没有,
38:43
但我看一看,
38:45
它会告诉我有了吗?
38:46
应该没有吧?
38:47
你可以把一个图表放进去,
38:50
然后它能理解这个图表是什么样的一个意思。
38:54
所以我觉得,
38:55
我目前还没有。
38:56
原著界的一些Paper里面的一些图表,
39:00
或者Flowchart之类的,
39:02
如果你能给它,
39:04
给到GPT4 Vision的API给它Translate,
39:07
然后它能Understand图表是什么,
39:09
然后Slides给一下Explanation,
39:11
或者你再拿去Generate一个新的图表,
39:14
我觉得可能会挺有想象力空间。
39:17
对的,
39:18
那么我们现在可以聊一下,
39:20
就是GPT最近新出了一个功能,
39:22
叫做GPT4V,
39:23
我记得我之前有微软的朋友,
39:27
他跟我透露说GPT的下一个版本叫做GPTV,
39:31
然后我们在猜测这个是GPTV5,
39:34
还是GPTV6的意思,
39:36
那么现在我们看到应该是GPTV6的意思,
39:39
然后呢,
39:40
不是GPTV6,
39:42
是GPTV4 Vision,
39:43
那么如果是这个GPTV6的话,
39:46
对,
39:47
它其实,
39:48
现在我们看到基本上能识别一个图片,
39:51
然后尤其是我图片里面的文字,
39:54
我这个看到一个特别有意思的截图,
39:56
有个人拍了一个停车场的一个牌子,
40:00
那上面有四五个牌子,
40:01
上面说几点到几点可以停,
40:03
几点到几点不能停,
40:04
几点到几点是什么需要收费的就停,
40:07
然后他就把这个牌子拍了一张照片,
40:11
然后发给GPTV,
40:13
然后问说,
40:14
那我们这个东西它到底,
40:16
比如说周三下午一点,
40:18
我可不可以免费停车,
40:20
然后GPTV就告诉他可以了,
40:22
我觉得这可能就是一个非常实际的一个例子,
40:26
那么就是说Vision可以去识别图片中的信息,
40:30
然后可以做出一个解答,
40:32
然后这个东西可能将来未来,
40:35
比如说在一些其他的领域也可以用得到,
40:38
那么比较,
40:39
但是我觉得它带来一个影响,
40:41
就是说可能有些创业公司又要死了,
40:45
就比如说我知道这个可能是我朋友的公司,
40:51
比如说他们做的就是我去发一个图片,
40:57
然后这个图片里面可能是一个数学题,
40:59
然后我帮你去解答,
41:01
那么这种东西如果原来应该是GPTV不能解决的,
41:07
那么现在GPTV可以解决了,
41:09
他们这个功能就突然就没有用了,
41:11
所以我觉得这些都是一个很有意思的一些发现。
41:17
然后Meta也开始做眼镜了,
41:19
然后明年Lama 2可能会做一个软件更新支持Vision,
41:24
然后之后他们的眼镜可能就可以实时地采取图片或者视频,
41:29
然后你可以Ask Lama 2,
41:31
然后Lama 2会告诉你看到的这个东西是什么意思。
41:35
对,Meta这个公司也很有意思,
41:38
我觉得它好像就是说,
41:41
它之前一直想做这个语言宇宙,
41:43
这个语言宇宙做得不是很顺,
41:45
但是它现在要做这个AI,
41:48
然后我觉得它的AI的功力还是不错的。
41:51
OK, Somehow AI可以把语言宇宙给做出来,
41:55
因为你可以想象,
41:56
如果你戴着一个钢铁侠眼镜,
41:58
然后你有一个JARVIS,
42:00
实时告诉你看到这个东西是什么样子,
42:03
然后你可以采集到你看到的所有东西,
42:06
你可以说过去六个月我有没有见过这个人,
42:09
然后AI可以告诉你,
42:11
你听过这个人,
42:13
对,那这个确实是很有用的功能,
42:15
对,我有个电脑,
42:16
所以我可能很需要这样的功能,
42:18
因为我经常记不起来谁是谁。
42:20
对,或者就是别人的名片你看一眼之后,
42:23
你名片就不用收起来了,
42:26
就直接问你的AI,
42:28
我以前见过的哪个店的销售,
42:31
他的电话是多少,
42:32
给他打个电话说我要买啥啥啥。
42:35
可能比较适合你的Live chat,
42:38
我基本上不会见到某个店的销售。
42:42
然后对我工作相关来说,
42:46
我觉得我对agent方面的一些research,
42:50
或者新的framework,
42:52
mechanism的发展还是会很感兴趣,
42:55
因为一方面我们刚刚说了,
42:57
这些很多都是非常agency的一些work,
43:01
你问你的assistant一个问题,
43:04
然后他会去调一些数据,
43:06
或者做一些research,
43:07
然后带给你一些答案,
43:09
所以我觉得在model之上,
43:12
怎样做一个autonomous agent,
43:15
然后去调用model的不停的功能,
43:17
interact with real world,
43:19
我觉得这非常有意义的一个方向。
43:23
然后对于我们公司产品的话,
43:25
agent的很多也是你问一个问题,
43:28
你怎么去调用你存在database里的所有的data,
43:33
然后interact with some external services,
43:37
或者是generate一些新的数据,
43:41
我觉得都是把现有的你存在database的数据,
43:45
变得更有价值的事情,
43:47
然后这个价值也都可以translate成
43:49
这个公司创造的价值得到的营收,
43:52
所以我觉得还是,
43:54
前景还是很光明的。
43:56
对,当然了,
43:59
AI也给大家来很多挑战,
44:01
我觉得尤其是就是说,
44:02
如果AI会不会去代理一个员工工作的时候,
44:05
可能是一个很严重的事情,
44:07
其实我就在想,
44:08
这么多公司的裁员,
44:09
他一方面争取选一,
44:11
另一方面是不是,
44:12
因为AI也确实可以取代一部分人的工作,
44:15
就是说它不能完全只代一个人,
44:17
但是它可以把三个人的活变成两个人的活,
44:19
变成一个人的活,
44:21
如果是这样子的,
44:23
那其实确实就已经有点取代别人工作的感觉了。
44:27
我觉得现在可能还不是很明显,
44:30
因为很多use case还没有,
44:32
还都没有figure out,
44:34
然后很多AI产品的accuracy,
44:37
hallucination,
44:38
其实都没有很好的解决,
44:40
我觉得这一波的裁员还更多的是经济,
44:43
宏观经济情况,
44:45
或公司的budget的一些constraint来代替。
44:50
I see.
44:51
就如果AI产品们可以做到一个比较好的quality的一个程度,
44:57
真的可以取代现有的很多工作,
45:00
或者做一个copilot的形式,
45:02
让大家工作的10x更有效率,
45:05
我觉得对job market会有一个很大的影响。
45:10
我不知道会不会就是说大家会失业,
45:15
没有工作了,
45:16
还是说大家会可以去做更有意思,
45:21
或者更有价值的工作,
45:24
因为更重复性的工作会被机器AI给取代,
45:30
所以我觉得很不好说,
45:32
就比如说以前大家和尚们手抄书,
45:36
现在全被打印机取代了,
45:38
但并不代表大家就没有工作,
45:41
而大家去做更有价值的工作,
45:43
创造更多的价值,
45:44
也会让我们的生活变得更好。
45:46
所以我觉得AI safety,
45:49
包括对society的影响,
45:51
也是现在争论很多的话题,
45:54
我觉得可能也得在未来的几个decade都会持续关注吧。
46:00
OK,感谢前来今天聊天,
46:03
期待下次和你再聊。
46:06
拜拜。
46:07
拜拜。