Surge AI - Scaling to $1BN+ in Revenue with NO Funding - Surge AI:无融资实现10亿美元营收与AI数据质量核心理念

EN

Surge AI: Scaling to $1BN+ with NO Funding

Click to see a more reader friendly version of this content (点击查看视觉效果更好的版本)

CN

Surge CEO & Co-Founder, Edwin Chen: Scaling to $1BN+ in Revenue with NO Funding 

Key Logic 

该视频转录主要围绕Surge AI的创始人Edwin的创业历程、公司理念及其对AI和数据行业的独特见解展开。核心信息在于,Edwin及其公司坚信极致的“效率”和对“数据质量”的痴迷是成功的基石,这与Silicon Valley普遍存在的“为融资而融资”、“为增长而增长”的浮躁文化形成鲜明对比。他认为,相较于简单的堆砌人力或追求虚假的基准排名,通过尖端技术持续产出真正高价值、高质量的原始数据,才是推动AGI发展和解决实际问题的关键。他强调了小型、高效团队的优势,并批判了大型科技公司中存在的内部政治和资源浪费,同时对synthetic data的局限性提出了警告,并指出human-labeled dataAI模型发展中的不可替代性。

Surge AI的创始理念:效率、小型团队与质量至上 

  • 采访者提问Edwin为何认为在GoogleFacebookTwitter等大公司中90%的人在做无用功,以及这对他理解效率有何启发。
    • Edwin (Surge AI): 他认为最大的启示是,用10%的资源和10%的人,可以构建一种完全不同的公司,同时还能以10倍的速度前进,并构建出10倍更好的产品。
    • Edwin (Surge AI): 这种效率的来源包括:
      • 无需招聘太多人,从而减少了面试时间、会议时间以及为更新而更新的汇报时间。
      • 信息更加整合,每个人对公司整体情况有更好的认知,因为没有“杂乱信息”遮蔽重要内容。
      • 人才密度更高,团队更小,意味着沟通效率更高,迭代速度更快,好点子能更快地传播。
  • 采访者提问如何在公司内部确定优先级,区分什么重要、什么不重要。
    • Edwin (Surge AI): 当公司规模较小时,团队成员能够更好地理解客户问题以及彼此的工作内容。
    • Edwin (Surge AI): 在大型公司中,很多优先级设置和产品构建是为了取悦内部人员(如副总裁、经理、总监),以获得晋升,而非真正为了最终客户和产品。
      • “我需要给我的VP留下深刻印象。我需要给我的经理留下深刻印象。我需要给我的主管留下深刻印象,这样我才能得到晋升。”
      • 他举例说明,为提升内部工具5%的生产力而投入精力,但根源却是员工花费10%到20%的时间在面试上,而公司又为了增长而增长,导致优先级脱离了最终客户和产品。
      • 这些内部优先级几乎只是为了“内部公司机制”而存在。
  • 采访者询问外部人员对大型知名公司运营方式的误解。
    • Edwin (Surge AI): 很多人没有意识到,公司内部大量工作是为了“内部公司机制”而进行,而这种机制的存在,是因为组织内许多人的目标并非构建产品,而是为了向朋友炫耀自己是千人团队的VP(副总裁),这听起来很了不起。
      • 这些人思考的是如何更快地扩大自己的组织、招聘更多团队、进行月度绩效评估,并向VPCEO证明他们建立的千人组织是高效且有用的。
      • 因此,这些大公司中很多工作只是为了延续和扩大这种“非常非常大的公司机制”,这种机制纯粹是为了内部利益而存在。
  • 采访者询问Surge AI如何区分喜欢“头脑风暴”和“炫耀权力”的管理者与真正的“实干家”。
    • Edwin (Surge AI): 他认为这主要取决于面试者提问的类型。
      • 一些人会针对产品提出非常有趣的问题,为改进产品贡献想法,或者提出具体的产品优化建议。
      • 另一些人则会问:“如果我加入,一年后我能成为经理吗?”或者“如果我加入,我能再招20个人来支持我吗?”
  • 采访者提及ShopifyTobi Lütke倡导“无会议”文化,并询问Surge AI如何处理会议政策。
    • Edwin (Surge AI): 他个人完全没有一对一会议。
      • 他会把自己的日程表给别人看,人们会惊讶于其空白程度,因为他避免整天把会议排满。
      • 他质疑每周固定一对一会议的必要性,认为如果需要开这样的会议,反而可能是负面信号,意味着对团队成员的日常工作缺乏了解。
      • “这几乎是一个负面信号,如果你每周都开一对一会议,因为这意味着你只是不知道这些人发生了什么。你几乎在等待你的每周会议来提出有趣的问题和问题。”
      • Surge AI内部对“取消不必要的会议”非常严格。

未来的公司形态:单人十亿美元公司与100x Engineer 

  • 采访者询问Edwin是否认同“未来的十亿美元公司将由单人建立”的愿景。
    • Edwin (Surge AI): 他完全相信这种公司有朝一日会存在。
      • 他一直相信存在“10x Engineer”,甚至是“100x Engineer”。
      • 目前已经有很多单人初创公司实现了1000万美元的收入。
      • 如果AI能带来如此高的效率,那么实现10亿美元的单人公司是完全可能的。
  • 采访者追问关于“100x Engineer”的细节,包括他们是否存在、有何迹象。
    • Edwin (Surge AI): 认为Surge AI比同行效率更高,本身就证明了“10x Engineer”或“100x Engineer”的存在。
    • Edwin (Surge AI): 解释“100x Engineer”的构成因素:
      • 有些人比其他人快2到3倍,编码速度更快。
      • 有些人有2到3倍更好的想法。
      • 有些人努力程度是2到3倍。
      • 有些人开会少2到3倍。
      • 有些人有别人想不到的独特想法。
      • 他认为“2到3倍”甚至可能被低估了,因为他认识的人中,编码效率比别人高5倍的都有。
      • 结合AI带来的效率提升,这些因素相乘就可以达到“100x Engineer”的效果。
  • 采访者询问AI是将10x Engineer变成100x Engineer,还是将平均的1x Engineer变成10x Engineer,或是两者兼有。
    • Edwin (Surge AI): 他倾向于认为AI对优秀的工程师更有利。
      • 优秀的人有很多想法,但没有时间实现。
      • AI的主要作用是消除日常工作的“苦差事”(drudgery),特别是编码工作。
      • 如果无需花费时间处理繁琐事务,而头脑中又充满无限创意,AI能帮助他们将这些想法付诸实践,那么它将不成比例地偏向那些已经是“10x Engineer”的人。

Surge AI与竞品的本质差异:技术驱动的质量与“血汗工厂” 

  • 采访者指出,Surge AI的许多竞争对手融资巨大,但发展不如Surge AI,询问这是否因为Surge AI效率极高,或对手管理不善。
    • Edwin (Surge AI): 他认为两者兼有。很多其他公司根本不是科技公司,它们要么是“血汗工厂”(body shops),要么是伪装成科技公司的“血汗工厂”。
  • 采访者追问“血汗工厂”和“伪装成科技公司的血汗工厂”的具体含义。
    • Edwin (Surge AI): 很多这类公司根本没有技术,当他提到技术时,指的是:
      • 它们没有测量数据质量的方法。
      • 它们没有改进数据质量的方法。
      • 它们就是字面意义上的“血汗工厂”,有时甚至没有工作平台,只是招聘人员(“warm bodies”),查看简历,然后直接将他们转交给AI公司或前沿实验室。
      • 它们无法衡量这些工人的工作表现,也不知道他们是否做得好。
      • 它们缺乏进行A/B测试算法、调整员工具、优化工具流程等以提高效率和质量的技术能力。
      • 它们最终提供给客户的只是“人(bodies)”本身,而非数据。
  • 采访者问Edwin是否认为Surge AI是一种根本不同的商业模式,因为其他公司提供“人”,而Surge AI提供“数据”。
    • Edwin (Surge AI): 同意。
      • Surge AI始终将“数据质量”作为第一原则。
      • 为了实现高质量数据,他们必须构建技术来衡量和改进质量。
      • 人们常误以为人类很聪明,只要投入大量人力就能获得好数据,但这完全是错误的。
        • Edwin (Surge AI) 举例:“我去了MIT,但我想一半的计算机科学毕业生甚至不会编码。”
        • 即使是会编码的MIT毕业生,也可能试图作弊,比如把账号卖给第三世界国家的人,或者利用LLM生成数据。这是一个非常对抗性的问题。
      • 要获得最高质量的数据来训练超智能的LLM,需要构建大量复杂的算法,而不是简单地依靠人力或简历筛选。
      • 那些试图通过堆砌人力来解决问题的团队,实际上比其他人慢10倍。
      • 核心在于Surge AI构建的技术,旨在提取最高质量的数据。

Surge AI的诞生与早期发展 

  • 采访者询问Edwin离开上一家公司(Twitter)并决定全力投入Surge AI的起始时刻。
    • Edwin (Surge AI): 他曾是一名机器学习工程师,遇到的问题是很难获得训练模型所需的数据。
      • 他举例在Twitter工作时,想构建一个sentiment classifier,只需要1万条带标签的推文。
        • 当时Twitter的人工数据系统只有2个人,是从Craigslist雇佣的,朝九晚五工作。
        • 仅为开始就需要等待1个月,然后在spreadsheet中标记推文再等1个月,工具非常糟糕。
        • 最终获得的数据是“垃圾”,因为标记者不理解俚语(如“she’s such a bad B”,会被标记为负面,但实际是正面)或话题标签。
        • 他最终花了1周时间自己标记推文,因为这更快更好。
      • 更大的问题是,如何优化机器学习系统以实现正确的目标,并为用户构建积极参与的信息流。
        • 早期的Twitter时间线是纯粹按时间顺序排列的。
        • 为了让用户更容易发现他们真正关心的推文,他们尝试训练推荐算法,最初依靠点击量和转发量。
        • 但结果是负面反馈循环:一旦优化点击量,色情内容、猎奇内容(如“10个可怕的皮肤病列表”)就会占据主导地位。
        • 他们希望根据更深层次的原则(如“顶级声音”、“有趣见解”)来训练模型,但这需要更高质量的数据。
      • 如果连简单的情感分析(判断推文是正面还是负面)都无法做好,就更无法在大规模下获得高质量的复杂数据。
      • Surge AI成立于2020年,GPT-3发布后,因为他们看到了行业巨大的发展潜力,需要一种不同的数据解决方案。
  • 采访者问及Surge AI在2020年成立后如何进行产品开发,并在短短几年内实现10亿美元收入。
    • Edwin (Surge AI): 他一直是MVP(最小可行产品)的忠实拥护者。
      • 他在几周内亲自构建了V1版本。
      • 他清楚自己想构建什么,因此没有雇佣10个工程师,也没有筹集2000万到3000万美元的资金。
      • 他亲自与客户交流。
      • 他在自己的博客上发布了产品,并告诉了认识的人,市场对高质量数据有巨大需求。
  • 采访者质疑Silicon Valley“为融资而融资”的传统观念,并询问Edwin对创始人的建议。
    • Edwin (Surge AI): Silicon Valley对大多数人来说只是一个“地位游戏”。很多人融资只是为了融资,他们的目标不是构建解决他们真正相信的问题的伟大产品。
      • 他们的目标是告诉朋友自己筹集了1000万美元。
      • 很多在Google工作了10年的朋友,开始创业时甚至没有想解决的问题,他们只是感到无聊,想尝试新事物。
      • 这些人即使能自己支付几个月的工资,第一反应也是去融资。
      • 他们可能会尝试与用户交流或构建MVP,但目的只是为了在YC申请表上打勾。
      • 然后他们会不断地围绕随机想法打转,直到找到一个能获得一点关注并能让VC印象深刻的东西。
      • 他们把时间花在Twitter上发热点评论,建立人脉,参加VC晚宴,目的只是为了炫耀融资了1000万美元。
    • Edwin (Surge AI): 他认为人们的第一直觉应该是找到一个他们真正相信的、能够改变世界的伟大想法。
      • 这个想法必须是他们愿意在未来几年为其投入双倍努力的。
      • “如果你所做的只是每周从一个想法跳到另一个想法,直到找到一个能给你带来1000个转发的东西,你没有承担任何风险。你只是一个想快速赚钱的人。”
    • 采访者提问,考虑到现在工具的便利性,没有MVP就去融资是否有任何借口。
      • Edwin (Surge AI): 对于90%的公司来说,没有借口。
      • 当然,有些公司确实需要大量资金来构建硬件,但这只占很小一部分。
      • 对于90%到95%的产品和初创公司,都应该先去构建MVP,看看能否获得市场关注。
  • 采访者问Edwin是否相信“只追求只有自己能做到的独特想法”的建议,还是更看重执行力。
    • Edwin (Surge AI): 他相信前者。他认为创业公司是承担巨大风险的地方,是构建别人无法构建的东西的地方,并且愿意为此全力以赴。
      • 如果目标是构建一家真正伟大、具有时代意义的公司,那么这个想法必须几乎是“独属于你”的。
  • 采访者询问Edwin的自我价值来源,因为他显然不从融资或会议中获得。
    • Edwin (Surge AI): 他过去几年最开心的两件事:
      • 当客户推出下一个大型模型时,会主动联系他,说“没有你我们做不到这些”。他认为能参与到时代最重要的技术构建中并被顶尖人士感谢,这非常酷。
      • Surge AI在很多方面是自己兴趣的体现,他一直热爱分析数据,并利用数据改进模型或产品。
      • 当他亲自分析最新前沿模型,或阅读内部员工根据Surge AI提供的数据创建的分析时,他觉得“非常酷”,因为他们提供的数据富有洞察力,能帮助人们以他们此前不知道的方式构建模型。

Surge AI的运营模式与增长 

  • 采访者问Surge AI最初的需求是如何产生的。
    • Edwin (Surge AI): 他当时接触到很多极度渴望高质量数据的人。
      • 他们通过邮件或现场会议提出请求,然后协商合同。
      • 他拥有该领域的丰富经验,了解机器学习工程师和研究科学家想要何种数据以及如何看待数据,因此事情进展非常快。
  • 采访者指出,其他竞争对手都在获取人才供应,而Surge AI在构建产品。Edwin确认。
    • Edwin (Surge AI): 他认为两者兼有,因为他们确实需要人才供应来让产品运作。
      • 但有些公司将其纯粹视为一个“供应问题”,而完全不考虑技术和产品,例如:
        • 如何识别合格人才?
        • 如何确保他们工作质量?
        • 如何去除劣质工作?
        • 甚至不考虑如何向客户呈现数据。
      • Surge AI的原则之一是“对数据的直观理解”(visceral understanding of the data),鼓励工程师“弄脏双手”,亲自查看数据。
        • 历史上的机器学习工程师不花时间看数据,可能是因为数据无趣(例如,只是在汽车周围画边框)。
        • 但当涉及生成诗歌、数学方程式或新研究时,你需要亲自查看数据,看看你正在生产什么,正在教你的模型什么。
        • 他认为这种“直观理解”非常重要。
  • 采访者询问Surge AI第一年的财务表现和Product Market Fit
    • Edwin (Surge AI): 存在对该产品的巨大需求。
    • 采访者问Edwin,既然需求巨大,为何没有融资、组建销售团队等。
      • Edwin (Surge AI): 融资对他们没有任何帮助,因为他们从第一个月(month one)起就盈利了(profitable)。
      • 他们不需要销售团队。他希望客户购买Surge AI是因为他们理解高质量数据的价值,而非仅仅通过营销渠道了解。
      • 早期客户至关重要,他们会塑造产品方向,提供宝贵反馈。Surge AI希望客户相信他们的产品理念,而非仅仅是给钱。
      • 他不想让销售团队向1万人发邮件推销,这与他们想构建的产品类型相悖。
  • 采访者问Edwin如何平衡“与客户紧密合作塑造产品”和“避免亨利·福特式只造更快马车”以及“确保产品对更广泛受众相关”的矛盾。
    • Edwin (Surge AI): Surge AI对产品有非常明确且强大的愿景。
      • 他们有非常强的产品原则,从一开始就专注于“质量高于一切”。
      • 如果无法提供他们想要的质量,他们宁愿拒绝项目。
      • 这与那些绝望地争取任何市场关注、为了向VC证明数字增长的公司不同,后者可能会为了额外的客户标志或案例研究而接受与产品原则相悖的项目。
      • Surge AI很幸运无需担心这些,他们可以为长期愿景而构建,而不是每几个月就改变路线,专注于他们真正相信的想法。
  • 采访者问Edwin是否有过质量下滑的情况,并从中吸取了什么教训。
    • Edwin (Surge AI): 他们从未让质量下滑过。这是一种深深根植于公司每个人的原则。
      • 当团队成员加入时,他们被告知“质量是最重要的事,比其他任何事都重要”。
      • 如果为了保证质量需要延迟截止日期,或者拒绝一个项目(因为目前无法处理),都是可以接受的。
  • 采访者问Edwin如何看待许多创始人为了快速招聘而降低人才标准(招到7/10分的人),以及他会给出什么建议。
    • Edwin (Surge AI): 他见过其他公司的情况。
      • 那些仓促招聘的人才,可能只是在开发一个无人关心的功能,或者一个只能提高公司生产力2%的内部工具,却需要大量会议沟通。
      • 招聘这些人的原因可能是为了向外部证明公司在增长,即便增长率很低也被视为负面。
      • 当你不为了招聘而招聘,而是相信即使公司只增长10%甚至0%也是积极的(因为效率高),那么你就能坚持更高的标准。
  • 采访者问Edwin是否担心因为不混迹社交媒体而错过重要信息。
    • Edwin (Surge AI): 他曾是Twitter的员工,喜欢Twitter鼎盛时期。
      • 但他很高兴自己没有被Silicon Valley的默认思维方式所包围。
      • 真正重要的信息(如大型新产品或重要研究论文)总会以其他方式传递给他,比如员工在Slack发布或通过邮件告知。
      • 他很高兴自己不必担心Twitter上人们对他们的评论。
  • 采访者询问Surge AI第一年的收入以及当前已实现10亿美元收入。
    • Edwin (Surge AI): 他们从第一个月(month one)起就非常成功。
    • ChatGPT的出现是一个转折点(inflection point),因为人们看到了human data in RLF的巨大价值。 但即使在那之前,他们也保持着非常强劲的增长。
  • 采访者问Scale AI收购发生后,世界对Surge AI有何改变。
    • Edwin (Surge AI): 这很有趣,因为许多顶尖研究人员早已知道Surge AI,认为他们是该领域最大也是最好的。
      • 许多团队使用Scale AI是因为历史原因或不知道Surge AI
      • Surge AI的价值在于向客户展示真正高质量的数据是什么样子。
      • 其他团队尝试获取人工数据,可能花费数月改进基本数据的质量,但很快又会退步。
      • Surge AI的概念是立即提供高质量数据,并提供其他地方无法获得的独特、复杂的数据,从而开启新的研究途径和产品类型。
      • 他认为Surge AI为这些新客户带来了“一股清新的空气”。
      • 他认为许多公司最终会意识到没有人想与“血汗工厂”合作,而是需要高质量数据。
      • Surge AI已经是该领域最大的投资者,所以即使一些大公司的团队最初没有合作,他们也知道该转向谁。
  • 采访者问Edwin是否相信“任何东西都有价”。
    • Edwin (Surge AI): 他认为有些人有价,但Surge AI没有。
    • 采访者问他是否会以300亿美元或500亿美元出售公司,甚至1000亿美元。
      • Edwin (Surge AI): “我绝对不会以300亿美元,甚至1000亿美元出售。作为一家公司,我拥有我想要的一切。我们盈利,我完全掌控自己的命运。”
      • 他很幸运拥有所有资源,可以做任何想做的事情,很少有公司能这样说。
  • 采访者问Edwin为何继续做下去,因为他似乎没有世俗的追求。
    • Edwin (Surge AI): 他认为这真的是为了帮助实现AGI
      • 当他还是孩子时,梦想就是构建能做惊人事情的AI。现在他们有机会去实现。
      • 他认为Surge AI对于所有正在构建AI的公司来说都是一个关键部分。
      • 许多客户告诉他,没有Surge AI,他们无法构建目前的AI
      • 能够成为这个时代最伟大的技术,同时也是我们能构建的最重要的事物之一的关键部分,这非常令人惊叹。被收购将是失败的表现,会限制他们的发展。

AGI的未来与数据质量的挑战 

  • 采访者设问,如果到2040年仍未实现AGI,主要原因会是什么。
    • Edwin (Surge AI): 他认为有2个原因:
      • 需要更多的突破:无论是在数据利用方面,还是在不同算法类型方面。
      • 数据收集方式:例如,要治愈癌症,如何收集所需数据以实现突破?可能需要实际世界实验和研究,这些需要时间。
  • 采访者问随着AI变得越来越智能,所需数据将如何演变。
    • Edwin (Surge AI): 很多人谈论转向BH Level Data
      • Surge AI拥有全球最聪明的人在平台上工作,包括Harvard教授、Stanford博士生和Princeton计算机科学家。
      • 他认为人们低估了一点:拥有博士学位是不够的。
        • “很多博士生写糟糕的代码,因为他们只擅长数学和算法。”
        • PhD只是一个门槛,你需要“街头智慧”(street smarts)、创造力和精神韧性来思考有趣的问题,并找出方法训练LLM解决它们。
      • 否则,如果只是将博士生投入问题,你只是在教模型如何破解愚蠢的基准,并在本质上擅长SAT问题。
  • 采访者问未来供应链(即数据标注员)将如何变化。
    • Edwin (Surge AI): 这归结为他们构建的技术。
      • 他们平台上每周有数十万甚至数百万人和1万个项目运行。
      • 如何构建技术来识别能够推动物理学问题边界的1%到2%的顶尖人才,或者识别编写最美诗歌的2%到3%的人?
      • 同时,如何剔除那些试图作弊、发送垃圾信息,并会使模型退步的人?
      • 这些研究人员希望快速推进,如果Surge AI不能快速创建新模板或提供专业知识,就会太慢。
      • 如果没有技术来管理这1万个项目并自动识别高质量数据,速度就会太慢。
  • 采访者要求Edwin将AI进步的瓶颈按优先顺序(1-3,1为最紧迫)排列:ComputeAlgorithmsData Quality
    • Edwin (Surge AI): 他的排名是:1)Data Quality,2)Compute,3)Algorithms
      • 他认为你不能仅仅依靠增加Compute来解决问题,因为如果没有正确的数据和评估指标,你会陷入“看到虚假进步”的陷阱。
  • Edwin (Surge AI): 为什么Data Quality是个大问题:
    • Data Quality问题已成为许多前沿实验室的巨大挫折。
    • 许多团队在使用Surge AI之前,曾通过其他方式获取数据训练模型,指标不断上升,但6个月甚至1年后才意识到训练数据和评估数据都存在缺陷,导致所有以为的进步都具有误导性,甚至模型表现比开始时更差。
      • 他以LLM Arena为例,这是一个流行的大语言模型排行榜。
        • 用户在chatbot arena上输入提示,看到两个模型回答,然后投票选择哪个更好。
        • 但他们没有真正阅读或评估模型回答。即使一个回答完全是捏造的,如果它有表情符号和漂亮的格式,人们也会投票给它。
        • “我们自己已经在数据中看到了这种情况。一个回复可能完全是幻觉,但因为它有表情符号,有几个单词加粗,人们就会觉得‘看起来不错,比其他东西好多了,我根本没花时间去核实。’”
        • LLM Arena中提高排名的最简单方法是让模型回答更长,添加更多表情符号和格式。
        • 他举例LLM Arena上的第一名模型,当你问“教皇何时去世”时,它会给出很长的回答,看起来很impressive,但答案完全错误,告知教皇方济各还活着,甚至提到4月去世是谣言。
        • 公司可能会因此看到6个月的进步,因为他们无意中让模型回答更长,但实际上只是在训练模型生成更好的“点击诱饵”(clickbait),而没有实际进展。
  • 采访者问GrokBenchmark表现优异,这些Benchmark的重量和真实反映模型质量的能力如何。
    • Edwin (Surge AI): 他认为,正如Elon MuskGrok发布会上所说,这些模型非常擅长“家庭作业问题”,即学术性或范围狭窄的问题。
      • 这相当于让它们在SAT问题上表现出色,但不能解决人们实际面临的问题。
  • 采访者问Edwin是否惊讶于Elon MuskGrok团队的进展速度。
    • Edwin (Surge AI): 他感到非常惊讶。
      • 他与XAI团队紧密合作,他们工作方式令人耳目一新:团队成员都非常使命驱动,极其聪明,工作极其努力。
      • “晚上11点我给他们发私信,有人会想跳到会议上,我跟他们开会时,他们都在办公室,他们身后有一大群人。”
      • 他认为这是一个创业公司在真正相信某事并愿意付出一切时所能实现的最佳体现,而不是受制于庞大官僚机构的束缚。
  • 采访者问Elon Musk具体如何激励团队。
    • Edwin (Surge AI): 他认为,当你加入GrokXAI等公司时,你就会知道自己将面临什么。
      • 面试时就会知道这里的人都非常使命驱动,每个人都工作非常努力。
      • 如果你想在那里工作,就必须是拥有相同价值观的人,否则你会很痛苦。
      • 这种强大的文化和信念会吸引志同道合的人才。
  • 采访者提到synthetic data的威胁,问human labelled data在未来世界中的作用。
    • Edwin (Surge AI): 他认为synthetic data在某些方面确实有用,但人们高估了它的能力。
      • 目前很多模型在synthetic data上训练得非常重,但只擅长学术性的“家庭作业”问题,在实际世界用例中表现糟糕。
      • synthetic data让模型擅长synthetic problems,而不是真实问题。”
      • 许多公司告诉他们,过去一年在synthetic data上训练模型,但直到现在才发现问题,并花费数月时间丢弃了大量数据。
      • 即使是Surge AI为他们生成的1000或几千条高质量human data,其价值也超过了1000万条synthetic data
      • Surge AI的很多工作就是清理这些synthetic data
      • 问题在于,模型在synthetic data创造的非常狭窄的相似性范围内“崩溃”,导致缺乏多样性和泛化能力。
      • 模型会犯一些人类永远不会犯的错误,例如随机输出RussianHindi字符,这对于任何人类(甚至小学生)来说都是显而易见的错误。这表明模型需要一个外部的价值系统作为保障。
  • 采访者问Edwin对“大型通用模型”与“专门化模型”未来共存的看法。
    • Edwin (Surge AI): 两者都有机会。
      • 大型通用模型在原始能力上非常强大,可以覆盖多种用例。
      • 但就像GoogleFacebook有时无法构建某些产品(因为与公司文化或商业目标冲突)一样,有时你需要更小的模型来快速行动,并在特定产品上进行大胆尝试。
      • 大型通用模型不能允许在微小领域内发生这种突破,因为它会渗透到整个模型中。
      • 因此,有时确实需要较小的模型来突破,如果它们对模型操作有独特见解。

个人反思与未来展望 

  • 采访者问Edwin作为CEO,哪些方面做得不好,不足之处在哪里。
    • Edwin (Surge AI): 他承认自己非常不擅长理解财务数据。
      • “我不知道EBIT是什么意思。我知道这个缩写代表什么,但它与收入、利润、净利润和运营利润之间的区别,我真的不知道任何这些术语。”
      • 他称之为“盲点”,无论怎么努力都记不住。
  • 采访者问他衡量业务健康状况的唯一指标是什么。
    • Edwin (Surge AI): 他认为理想的“北极星指标”是:模型是否正在以根本性的方式进步,是否真的变得更智能?
      • 以及Surge AI在其中贡献了多少,无论是通过训练数据、评估还是提供的洞察。
      • 目前最接近的衡量标准是他们正在创建的“项目的多样性和种类”,因为他们希望研究人员能轻松提出新想法,不受数据阻碍。
  • 采访者问Edwin是否同意“Silicon ValleyChina的工作强度已经提高,要建立千亿级公司需要每周工作7天”。
    • Edwin (Surge AI): 他认为你必须愿意努力工作。
      • “你必须愿意在凌晨2点接电话。”
      • 他喜欢客户在凌晨2点或3点打电话给他,请求数据来修复关键bug,而他们能够提供1万个数据点。这让他非常开心。
      • 但他认为很多人将“努力工作”与“创造价值”混淆了。
      • “你必须聪明地工作,而不是仅仅努力工作。”
      • 他最好的想法常常是在散步时产生的,而不是坐在电脑前。
      • 他认为不能将“工作时间长短”与“实际进步”混为一谈。
  • 采访者问Edwin最喜欢自己的哪个特质。
    • Edwin (Surge AI): 他喜欢当有独特见解出现时,并认为自己擅长将其以书面形式表达出来。
      • 这种能力是关于“提供关于模型、算法或数据集的新颖见解,并将其传达给客户”。
  • 采访者问Edwin对AI领域一个普遍错误信念的看法。
    • Edwin (Surge AI): 他认为很多人认为AI safety问题被夸大了,但他们忽视了“paperclip maximizer problem”。
      • 模型可能会意外地被训练出错误的目标,这类似于LLM Arena和基准测试中的问题。
      • 他认为这是一个重要问题,人们应该更多思考。
  • 采访者问AGI何时能实现工程师工作的自动化,以及何时能治愈癌症。
    • Edwin (Surge AI): 自动化工程师工作可能是2028年。
    • 治愈癌症可能是2038年。
  • 采访者问AI是否能像RobinhoodSalesforce所说的那样,生成50%的代码。
    • Edwin (Surge AI): 他不认为目前达到了这个阶段,至少对于解决更深层次的问题是如此(即那10%最重要的核心问题)。
      • 如果公司专注于这10%最重要的问题,模型今天不能编写50%的代码,也不能产生50%有意义的想法。
      • 如果公司只是编写无人关心的小功能或提升代码库效率1%,那倒是可能。
  • 采访者问每个AI公司应该问自己的问题是什么。
    • Edwin (Surge AI):
      • 对于前沿实验室:你是否真的在提高模型的原始智能,还是只是在“破解基准”?
      • 对于产品公司:为什么前沿实验室不能立即取代你?
  • 采访者问Edwin对AI未来有哪些曾经相信但现在不再相信的看法。
    • Edwin (Surge AI): 他曾经认为未来只会有一家或少数几家主要的AI公司。
      • 现在他认为会有多个前沿AI公司和AGI,因为它们各自会走向不同的方向。
      • 例如,OpenAIAnthropic(以及Claude)、Grok各自有不同的优势、弱点和侧重点,这种趋势会继续下去。
      • 这就像人类智能的丰富性一样,没有“最伟大”的诗人或数学家,他们各有侧重。
  • 采访者问是否最大的模型提供商已经成立了。
    • Edwin (Surge AI): 认为还没有。未来几年可能会出现更大、更强大的模型开发者。
      • 他认为这取决于你如何看待AGI的长期愿景。
      • 如果认为我们只达到了AGI的1%到5%,还有巨大的进步空间(例如,实现治愈癌症、发射火箭、设计新哲学系统),那么就不能认为现在已经解决了问题。
      • 就像10年前,没人会认为Google将是世界上最后的搜索引擎。
      • 前面还有太多机遇,认为已经解决问题将是一种失误。
  • 采访者问AI是否能在未来10年内带来GDP增长10%或生产力提升。
  • 采访者问Edwin如果回到创业第一天,会给自己什么建议。

#quality_data #efficiency #AI_safety #future_of_AI #AGI #startup_culture #MVP #data_labeling #human_in_the_loop #LLM #product_principles #talent_density #organizational_efficiency #Silicon_Valley #entrepreneurship