Surge AI - Scaling to $1BN+ in Revenue with NO Funding - Surge AI:无融资实现10亿美元营收与AI数据质量核心理念
EN
Surge AI: Scaling to $1BN+ with NO Funding
Click to see a more reader friendly version of this content (点击查看视觉效果更好的版本)
CN
Surge CEO & Co-Founder, Edwin Chen: Scaling to $1BN+ in Revenue with NO Funding
Key Logic
该视频转录主要围绕Surge AI的创始人Edwin的创业历程、公司理念及其对AI和数据行业的独特见解展开。核心信息在于,Edwin及其公司坚信极致的“效率”和对“数据质量”的痴迷是成功的基石,这与Silicon Valley普遍存在的“为融资而融资”、“为增长而增长”的浮躁文化形成鲜明对比。他认为,相较于简单的堆砌人力或追求虚假的基准排名,通过尖端技术持续产出真正高价值、高质量的原始数据,才是推动AGI发展和解决实际问题的关键。他强调了小型、高效团队的优势,并批判了大型科技公司中存在的内部政治和资源浪费,同时对synthetic data的局限性提出了警告,并指出human-labeled data在AI模型发展中的不可替代性。
Surge AI的创始理念:效率、小型团队与质量至上
- 采访者提问Edwin为何认为在Google、Facebook、Twitter等大公司中90%的人在做无用功,以及这对他理解效率有何启发。
- 采访者提问如何在公司内部确定优先级,区分什么重要、什么不重要。
- 采访者询问外部人员对大型知名公司运营方式的误解。
- 采访者询问Surge AI如何区分喜欢“头脑风暴”和“炫耀权力”的管理者与真正的“实干家”。
- Edwin (Surge AI): 他认为这主要取决于面试者提问的类型。
- 一些人会针对产品提出非常有趣的问题,为改进产品贡献想法,或者提出具体的产品优化建议。
- 另一些人则会问:“如果我加入,一年后我能成为经理吗?”或者“如果我加入,我能再招20个人来支持我吗?”
- Edwin (Surge AI): 他认为这主要取决于面试者提问的类型。
- 采访者提及Shopify的Tobi Lütke倡导“无会议”文化,并询问Surge AI如何处理会议政策。
未来的公司形态:单人十亿美元公司与100x Engineer
- 采访者询问Edwin是否认同“未来的十亿美元公司将由单人建立”的愿景。
- Edwin (Surge AI): 他完全相信这种公司有朝一日会存在。
- 他一直相信存在“10x Engineer”,甚至是“100x Engineer”。
- 目前已经有很多单人初创公司实现了1000万美元的收入。
- 如果AI能带来如此高的效率,那么实现10亿美元的单人公司是完全可能的。
- Edwin (Surge AI): 他完全相信这种公司有朝一日会存在。
- 采访者追问关于“100x Engineer”的细节,包括他们是否存在、有何迹象。
- Edwin (Surge AI): 认为Surge AI比同行效率更高,本身就证明了“10x Engineer”或“100x Engineer”的存在。
- Edwin (Surge AI): 解释“100x Engineer”的构成因素:
- 有些人比其他人快2到3倍,编码速度更快。
- 有些人有2到3倍更好的想法。
- 有些人努力程度是2到3倍。
- 有些人开会少2到3倍。
- 有些人有别人想不到的独特想法。
- 他认为“2到3倍”甚至可能被低估了,因为他认识的人中,编码效率比别人高5倍的都有。
- 结合AI带来的效率提升,这些因素相乘就可以达到“100x Engineer”的效果。
- 采访者询问AI是将10x Engineer变成100x Engineer,还是将平均的1x Engineer变成10x Engineer,或是两者兼有。
- Edwin (Surge AI): 他倾向于认为AI对优秀的工程师更有利。
- 优秀的人有很多想法,但没有时间实现。
- AI的主要作用是消除日常工作的“苦差事”(drudgery),特别是编码工作。
- 如果无需花费时间处理繁琐事务,而头脑中又充满无限创意,AI能帮助他们将这些想法付诸实践,那么它将不成比例地偏向那些已经是“10x Engineer”的人。
- Edwin (Surge AI): 他倾向于认为AI对优秀的工程师更有利。
Surge AI与竞品的本质差异:技术驱动的质量与“血汗工厂”
- 采访者指出,Surge AI的许多竞争对手融资巨大,但发展不如Surge AI,询问这是否因为Surge AI效率极高,或对手管理不善。
- Edwin (Surge AI): 他认为两者兼有。很多其他公司根本不是科技公司,它们要么是“血汗工厂”(body shops),要么是伪装成科技公司的“血汗工厂”。
- 采访者追问“血汗工厂”和“伪装成科技公司的血汗工厂”的具体含义。
- 采访者问Edwin是否认为Surge AI是一种根本不同的商业模式,因为其他公司提供“人”,而Surge AI提供“数据”。
Surge AI的诞生与早期发展
- 采访者询问Edwin离开上一家公司(Twitter)并决定全力投入Surge AI的起始时刻。
- Edwin (Surge AI): 他曾是一名机器学习工程师,遇到的问题是很难获得训练模型所需的数据。
- 他举例在Twitter工作时,想构建一个sentiment classifier,只需要1万条带标签的推文。
- 当时Twitter的人工数据系统只有2个人,是从Craigslist雇佣的,朝九晚五工作。
- 仅为开始就需要等待1个月,然后在spreadsheet中标记推文再等1个月,工具非常糟糕。
- 最终获得的数据是“垃圾”,因为标记者不理解俚语(如“she’s such a bad B”,会被标记为负面,但实际是正面)或话题标签。
- 他最终花了1周时间自己标记推文,因为这更快更好。
- 更大的问题是,如何优化机器学习系统以实现正确的目标,并为用户构建积极参与的信息流。
- 早期的Twitter时间线是纯粹按时间顺序排列的。
- 为了让用户更容易发现他们真正关心的推文,他们尝试训练推荐算法,最初依靠点击量和转发量。
- 但结果是负面反馈循环:一旦优化点击量,色情内容、猎奇内容(如“10个可怕的皮肤病列表”)就会占据主导地位。
- 他们希望根据更深层次的原则(如“顶级声音”、“有趣见解”)来训练模型,但这需要更高质量的数据。
- 如果连简单的情感分析(判断推文是正面还是负面)都无法做好,就更无法在大规模下获得高质量的复杂数据。
- Surge AI成立于2020年,GPT-3发布后,因为他们看到了行业巨大的发展潜力,需要一种不同的数据解决方案。
- 他举例在Twitter工作时,想构建一个sentiment classifier,只需要1万条带标签的推文。
- Edwin (Surge AI): 他曾是一名机器学习工程师,遇到的问题是很难获得训练模型所需的数据。
- 采访者问及Surge AI在2020年成立后如何进行产品开发,并在短短几年内实现10亿美元收入。
- 采访者质疑Silicon Valley“为融资而融资”的传统观念,并询问Edwin对创始人的建议。
- Edwin (Surge AI): Silicon Valley对大多数人来说只是一个“地位游戏”。很多人融资只是为了融资,他们的目标不是构建解决他们真正相信的问题的伟大产品。
- Edwin (Surge AI): 他认为人们的第一直觉应该是找到一个他们真正相信的、能够改变世界的伟大想法。
- 这个想法必须是他们愿意在未来几年为其投入双倍努力的。
- “如果你所做的只是每周从一个想法跳到另一个想法,直到找到一个能给你带来1000个转发的东西,你没有承担任何风险。你只是一个想快速赚钱的人。”
- 采访者提问,考虑到现在工具的便利性,没有MVP就去融资是否有任何借口。
- 采访者问Edwin是否相信“只追求只有自己能做到的独特想法”的建议,还是更看重执行力。
- Edwin (Surge AI): 他相信前者。他认为创业公司是承担巨大风险的地方,是构建别人无法构建的东西的地方,并且愿意为此全力以赴。
- 如果目标是构建一家真正伟大、具有时代意义的公司,那么这个想法必须几乎是“独属于你”的。
- Edwin (Surge AI): 他相信前者。他认为创业公司是承担巨大风险的地方,是构建别人无法构建的东西的地方,并且愿意为此全力以赴。
- 采访者询问Edwin的自我价值来源,因为他显然不从融资或会议中获得。
Surge AI的运营模式与增长
- 采访者问Surge AI最初的需求是如何产生的。
- Edwin (Surge AI): 他当时接触到很多极度渴望高质量数据的人。
- 他们通过邮件或现场会议提出请求,然后协商合同。
- 他拥有该领域的丰富经验,了解机器学习工程师和研究科学家想要何种数据以及如何看待数据,因此事情进展非常快。
- Edwin (Surge AI): 他当时接触到很多极度渴望高质量数据的人。
- 采访者指出,其他竞争对手都在获取人才供应,而Surge AI在构建产品。Edwin确认。
- Edwin (Surge AI): 他认为两者兼有,因为他们确实需要人才供应来让产品运作。
- 但有些公司将其纯粹视为一个“供应问题”,而完全不考虑技术和产品,例如:
- 如何识别合格人才?
- 如何确保他们工作质量?
- 如何去除劣质工作?
- 甚至不考虑如何向客户呈现数据。
- Surge AI的原则之一是“对数据的直观理解”(visceral understanding of the data),鼓励工程师“弄脏双手”,亲自查看数据。
- 历史上的机器学习工程师不花时间看数据,可能是因为数据无趣(例如,只是在汽车周围画边框)。
- 但当涉及生成诗歌、数学方程式或新研究时,你需要亲自查看数据,看看你正在生产什么,正在教你的模型什么。
- 他认为这种“直观理解”非常重要。
- 但有些公司将其纯粹视为一个“供应问题”,而完全不考虑技术和产品,例如:
- Edwin (Surge AI): 他认为两者兼有,因为他们确实需要人才供应来让产品运作。
- 采访者询问Surge AI第一年的财务表现和Product Market Fit。
- 采访者问Edwin如何平衡“与客户紧密合作塑造产品”和“避免亨利·福特式只造更快马车”以及“确保产品对更广泛受众相关”的矛盾。
- 采访者问Edwin是否有过质量下滑的情况,并从中吸取了什么教训。
- Edwin (Surge AI): 他们从未让质量下滑过。这是一种深深根植于公司每个人的原则。
- 当团队成员加入时,他们被告知“质量是最重要的事,比其他任何事都重要”。
- 如果为了保证质量需要延迟截止日期,或者拒绝一个项目(因为目前无法处理),都是可以接受的。
- Edwin (Surge AI): 他们从未让质量下滑过。这是一种深深根植于公司每个人的原则。
- 采访者问Edwin如何看待许多创始人为了快速招聘而降低人才标准(招到7/10分的人),以及他会给出什么建议。
- Edwin (Surge AI): 他见过其他公司的情况。
- 那些仓促招聘的人才,可能只是在开发一个无人关心的功能,或者一个只能提高公司生产力2%的内部工具,却需要大量会议沟通。
- 招聘这些人的原因可能是为了向外部证明公司在增长,即便增长率很低也被视为负面。
- 当你不为了招聘而招聘,而是相信即使公司只增长10%甚至0%也是积极的(因为效率高),那么你就能坚持更高的标准。
- Edwin (Surge AI): 他见过其他公司的情况。
- 采访者问Edwin是否担心因为不混迹社交媒体而错过重要信息。
- 采访者询问Surge AI第一年的收入以及当前已实现10亿美元收入。
- Edwin (Surge AI): 他们从第一个月(month one)起就非常成功。
- ChatGPT的出现是一个转折点(inflection point),因为人们看到了human data in RLF的巨大价值。 但即使在那之前,他们也保持着非常强劲的增长。
- 采访者问Scale AI收购发生后,世界对Surge AI有何改变。
- 采访者问Edwin是否相信“任何东西都有价”。
- 采访者问Edwin为何继续做下去,因为他似乎没有世俗的追求。
AGI的未来与数据质量的挑战
- 采访者设问,如果到2040年仍未实现AGI,主要原因会是什么。
- Edwin (Surge AI): 他认为有2个原因:
- 需要更多的突破:无论是在数据利用方面,还是在不同算法类型方面。
- 数据收集方式:例如,要治愈癌症,如何收集所需数据以实现突破?可能需要实际世界实验和研究,这些需要时间。
- Edwin (Surge AI): 他认为有2个原因:
- 采访者问随着AI变得越来越智能,所需数据将如何演变。
- 采访者问未来供应链(即数据标注员)将如何变化。
- 采访者要求Edwin将AI进步的瓶颈按优先顺序(1-3,1为最紧迫)排列:Compute、Algorithms、Data Quality。
- Edwin (Surge AI): 他的排名是:1)Data Quality,2)Compute,3)Algorithms。
- 他认为你不能仅仅依靠增加Compute来解决问题,因为如果没有正确的数据和评估指标,你会陷入“看到虚假进步”的陷阱。
- Edwin (Surge AI): 他的排名是:1)Data Quality,2)Compute,3)Algorithms。
- Edwin (Surge AI): 为什么Data Quality是个大问题:
- Data Quality问题已成为许多前沿实验室的巨大挫折。
- 许多团队在使用Surge AI之前,曾通过其他方式获取数据训练模型,指标不断上升,但6个月甚至1年后才意识到训练数据和评估数据都存在缺陷,导致所有以为的进步都具有误导性,甚至模型表现比开始时更差。
- 他以LLM Arena为例,这是一个流行的大语言模型排行榜。
- 用户在chatbot arena上输入提示,看到两个模型回答,然后投票选择哪个更好。
- 但他们没有真正阅读或评估模型回答。即使一个回答完全是捏造的,如果它有表情符号和漂亮的格式,人们也会投票给它。
- “我们自己已经在数据中看到了这种情况。一个回复可能完全是幻觉,但因为它有表情符号,有几个单词加粗,人们就会觉得‘看起来不错,比其他东西好多了,我根本没花时间去核实。’”
- 在LLM Arena中提高排名的最简单方法是让模型回答更长,添加更多表情符号和格式。
- 他举例LLM Arena上的第一名模型,当你问“教皇何时去世”时,它会给出很长的回答,看起来很impressive,但答案完全错误,告知教皇方济各还活着,甚至提到4月去世是谣言。
- 公司可能会因此看到6个月的进步,因为他们无意中让模型回答更长,但实际上只是在训练模型生成更好的“点击诱饵”(clickbait),而没有实际进展。
- 他以LLM Arena为例,这是一个流行的大语言模型排行榜。
- 采访者问Grok在Benchmark表现优异,这些Benchmark的重量和真实反映模型质量的能力如何。
- 采访者问Edwin是否惊讶于Elon Musk和Grok团队的进展速度。
- 采访者问Elon Musk具体如何激励团队。
- 采访者提到synthetic data的威胁,问human labelled data在未来世界中的作用。
- Edwin (Surge AI): 他认为synthetic data在某些方面确实有用,但人们高估了它的能力。
- 目前很多模型在synthetic data上训练得非常重,但只擅长学术性的“家庭作业”问题,在实际世界用例中表现糟糕。
- “synthetic data让模型擅长synthetic problems,而不是真实问题。”
- 许多公司告诉他们,过去一年在synthetic data上训练模型,但直到现在才发现问题,并花费数月时间丢弃了大量数据。
- 即使是Surge AI为他们生成的1000或几千条高质量human data,其价值也超过了1000万条synthetic data。
- Surge AI的很多工作就是清理这些synthetic data。
- 问题在于,模型在synthetic data创造的非常狭窄的相似性范围内“崩溃”,导致缺乏多样性和泛化能力。
- 模型会犯一些人类永远不会犯的错误,例如随机输出Russian或Hindi字符,这对于任何人类(甚至小学生)来说都是显而易见的错误。这表明模型需要一个外部的价值系统作为保障。
- Edwin (Surge AI): 他认为synthetic data在某些方面确实有用,但人们高估了它的能力。
- 采访者问Edwin对“大型通用模型”与“专门化模型”未来共存的看法。
个人反思与未来展望
- 采访者问Edwin作为CEO,哪些方面做得不好,不足之处在哪里。
- 采访者问他衡量业务健康状况的唯一指标是什么。
- 采访者问Edwin是否同意“Silicon Valley和China的工作强度已经提高,要建立千亿级公司需要每周工作7天”。
- Edwin (Surge AI): 他认为你必须愿意努力工作。
- “你必须愿意在凌晨2点接电话。”
- 他喜欢客户在凌晨2点或3点打电话给他,请求数据来修复关键bug,而他们能够提供1万个数据点。这让他非常开心。
- 但他认为很多人将“努力工作”与“创造价值”混淆了。
- “你必须聪明地工作,而不是仅仅努力工作。”
- 他最好的想法常常是在散步时产生的,而不是坐在电脑前。
- 他认为不能将“工作时间长短”与“实际进步”混为一谈。
- Edwin (Surge AI): 他认为你必须愿意努力工作。
- 采访者问Edwin最喜欢自己的哪个特质。
- Edwin (Surge AI): 他喜欢当有独特见解出现时,并认为自己擅长将其以书面形式表达出来。
- 这种能力是关于“提供关于模型、算法或数据集的新颖见解,并将其传达给客户”。
- Edwin (Surge AI): 他喜欢当有独特见解出现时,并认为自己擅长将其以书面形式表达出来。
- 采访者问Edwin对AI领域一个普遍错误信念的看法。
- Edwin (Surge AI): 他认为很多人认为AI safety问题被夸大了,但他们忽视了“paperclip maximizer problem”。
- 模型可能会意外地被训练出错误的目标,这类似于LLM Arena和基准测试中的问题。
- 他认为这是一个重要问题,人们应该更多思考。
- Edwin (Surge AI): 他认为很多人认为AI safety问题被夸大了,但他们忽视了“paperclip maximizer problem”。
- 采访者问AGI何时能实现工程师工作的自动化,以及何时能治愈癌症。
- Edwin (Surge AI): 自动化工程师工作可能是2028年。
- 治愈癌症可能是2038年。
- 采访者问AI是否能像Robinhood和Salesforce所说的那样,生成50%的代码。
- Edwin (Surge AI): 他不认为目前达到了这个阶段,至少对于解决更深层次的问题是如此(即那10%最重要的核心问题)。
- 如果公司专注于这10%最重要的问题,模型今天不能编写50%的代码,也不能产生50%有意义的想法。
- 如果公司只是编写无人关心的小功能或提升代码库效率1%,那倒是可能。
- Edwin (Surge AI): 他不认为目前达到了这个阶段,至少对于解决更深层次的问题是如此(即那10%最重要的核心问题)。
- 采访者问每个AI公司应该问自己的问题是什么。
- Edwin (Surge AI):
- 对于前沿实验室:你是否真的在提高模型的原始智能,还是只是在“破解基准”?
- 对于产品公司:为什么前沿实验室不能立即取代你?
- Edwin (Surge AI):
- 采访者问Edwin对AI未来有哪些曾经相信但现在不再相信的看法。
- 采访者问是否最大的模型提供商已经成立了。
- 采访者问AI是否能在未来10年内带来GDP增长10%或生产力提升。
- Edwin (Surge AI): 他绝对相信。
- 采访者问Edwin如果回到创业第一天,会给自己什么建议。
- Edwin (Surge AI): “永远专注于你能实现的10x improvements,而不是担心10% realities。”
#quality_data #efficiency #AI_safety #future_of_AI #AGI #startup_culture #MVP #data_labeling #human_in_the_loop #LLM #product_principles #talent_density #organizational_efficiency #Silicon_Valley #entrepreneurship