a16z 五位关注消费领域投资的合伙人在讨论中透露,当前的 AI 工具虽强大,但尚未建立社交结构,缺乏「连接性」的平台支点。
撰文:有新
从 Facebook 到 TikTok,消费产品曾以连接人与人的方式推动社交演化。但在 AI 驱动的新周期中,「完成任务」正取代「建立关系」成为产品主线。ChatGPT、Runway 和 Midjourney 等产品代表着新的入口,它们不仅重塑内容生成方式,也改变了用户付费结构与产品变现路径。
a16z 五位关注消费领域投资的合伙人在讨论中透露,当前的 AI 工具虽强大,但尚未建立社交结构,缺乏「连接性」的平台支点。
消费级爆款产品的缺席,反映出平台与模型之间仍存在断层。真正 AI 原生的社交系统仍未出现,这一空白可能孕育出下一代超级应用。a16z 平台战略前世今生:从 VC 「不愿擦屁股」到「全栈服务」。
与此同时,AI 分身、语音 agent 与数字人格等产品形态已初具雏形,其意义远不止陪伴或工具,而是构建新的表达机制与心理关系。未来平台的核心竞争力,或将转向模型能力、产品演化速度与认知系统集成水平。
过去二十年,消费领域每隔几年便会涌现出代表性产品,从 Facebook、Twitter 到 Instagram、Snapchat、WhatsApp、Tinder、TikTok,每一款产品都曾推动一次社交范式的演化。近年来,这种节奏似乎出现停滞,引发一个重要问题:创新是否真的暂停,或我们对于「消费产品」的定义正面临重构。
在新的周期中,ChatGPT 被认为是最具代表性的消费级产品之一。它虽非传统意义上的社交网络,却已深刻改变了人们与信息、内容乃至工具的关系。诸如 Midjourney、ElevenLabs、Blockade Labs、Kling、VEO 等工具在音视频和图像领域迅速普及,但其中多数尚未建立人与人之间的连接结构,不具备社交图谱属性。
当前多数 AI 创新仍由模型研究者主导,具备技术深度却缺乏终端产品构建经验。随着 API 与开源机制的普及,底层能力正在释放,新的消费级爆款也可能由此诞生。
过去二十年的消费互联网发展,Google、Facebook 和 Uber 的成功,根植于互联网、移动设备与云计算三大底层浪潮。当前的演化则来自模型能力的跃迁,技术节奏不再表现为功能更新,而是由远程升级的模型所驱动。
消费产品的主线也发生转移,从「连接人」走向「完成任务」。Google 曾是信息获取工具,ChatGPT 正在逐步接替其角色。Dropbox、Box 等工具型产品虽未建立社交图谱,但依然在消费者端具备广泛渗透力。尽管内容生成需求持续上升,AI 时代的连接结构尚未建立,这一空白也许是下一轮突破的方向。
传统社交平台的护城河正面临重估。在 AI 崛起背景下,平台主导权或正从构建关系图谱转向构建模型与任务系统的能力。OpenAI 等技术主导型公司,是否正成为下一代平台公司,值得关注。回报只能靠 OpenAI?硅谷 20 年美元基金创始人警告 VC 模型正濒临失效。
从商业模型来看,AI 产品的变现能力远超以往消费工具。过去即使是头部应用,用户平均收入仍较低。如今,顶级用户每月付费可达 200 美元,超过多数传统科技平台的上限。这意味着企业可以绕过广告和漫长的变现路径,直接通过订阅获取稳定收入。早期过度强调网络效应与护城河,本质上是因为产品变现能力薄弱。而今天,只要工具足够有价值,用户自然愿意付费。
这一变化带来了结构性转折。传统「弱商业模式」迫使创始人围绕用户粘性、生命周期价值等指标构建叙事,而 AI 产品凭借直接收费能力,在上线初期便可闭环商业逻辑。
虽然如 Claude、ChatGPT、Gemini 等模型在功能层面看似相似,但用户实际体验存在显著差异。这种偏好差异催生出各自独立的用户群体。市场非但未出现价格战,反而呈现头部产品持续提价的趋势,显示出差异化竞争结构已逐步建立。
AI 也正在重构「留存率」的定义。在传统订阅产品中,用户留存即决定收入留存。而如今,用户可能持续使用基础服务,却因更频繁调用、更大额度积分或更高质量模型而选择升级订阅。收入留存显著高于用户留存,属以往所未见。
AI 产品的定价模型正发生根本性转变。传统消费类订阅每年费用多在 50 美元上下,如今大量用户愿意每月支付 200 美元,甚至更高。这种价格结构的可接受性,源于用户体验到的实际价值发生了本质变化。
AI 产品之所以能够被高溢价接受,在于其不再只是「辅助改善」,而是真正「替用户完成任务」。以研究类工具为例,原本需十小时手动整理的报告,如今几分钟内即可生成。即使全年只使用数次,该服务也具备合理的付费预期。
在视频生成领域,Runway 的 Gen-3 模型被认为代表了新一代 AI 工具的体验进化。通过自然语言提示即可生成风格各异的视频,支持语音与动作定制。部分用户使用该工具制作带朋友名字的专属视频,也有创作者生成完整动画作品上传至社交平台。这种「几秒生成、立即使用」的交互体验,前所未有。
从消费结构来看,未来用户的主要支出将高度集中在三类:吃饭、房租与软件。软件作为通用工具,其渗透速度正在不断提升,支出占比持续上升,已开始吞噬原本属于其他品类的预算空间。
娱乐、创作,甚至人际关系本身,正在被 AI 工具逐步中介化。许多过去依赖线下交流或社交互动才能完成的事情,如今可以通过订阅模型来实现,从视频生成到写作协助,甚至替代一部分情感表达。
在这一趋势下,人与人之间的连接机制也正面临重新思考的必要。尽管用户仍活跃于 Instagram、Twitter 等传统平台,真正意义上的新一代连接方式尚未出现。
社交产品的本质,始终围绕「状态更新」展开。从文字到图片、再到短视频,媒介不断演进,但底层逻辑始终是「我在干嘛」——意在建立存在感,获得反馈。这种结构构成了上一代社交平台的基础。
当下的问题在于,AI 能否催生一种全新的连接方式?模型交互已深入用户生活。每天与 AI 工具的大量对话中,输入了极为个人化的情绪与需求。这种长期输入极有可能比搜索引擎更了解用户,如果被系统性提取并外化为「数字自我」,人与人之间的连接逻辑将可能被重构。
部分早期现象已初步显现。例如在 TikTok 上,开始出现基于 AI 反馈的人格测试、漫画生成与内容模仿。这些行为不再仅仅是内容生成,更是一种「数字映射」的社交表达。用户不仅生成,还主动分享,引发模仿与互动,显示出对「数字自我表达」的高度兴趣。
但这一切仍然局限在旧平台结构之内。无论是 TikTok 还是 Facebook,尽管内容更智能,信息流结构与交互逻辑几乎未发生变化。平台未因模型爆发而真正演进,只是成为生成内容的托管容器。
生成能力的跃迁,尚未找到与之匹配的平台范式。大量内容缺乏结构化呈现与交互组织,反而被平台现有的内容架构消解为信息噪声。旧平台承担的是内容承载功能,而非社交范式的重建引擎。
当下的平台更像是「旧系统披上新皮肤」。短视频、Reels 等形式尽管外观现代,调性年轻,但其背后的逻辑仍然未脱离信息流推送与点赞分发的范式束缚。
一个未解的核心问题是:第一款真正「AI 原生」的社交产品会是什么样?
这不应是模型生成的图像拼贴、信息流的视觉刷新,而是一个可以承载真实情绪波动、引发连接与共鸣的系统。社交的本质从来不是完美展演,而在于不确定性——尴尬、失败与幽默构成情感的张力结构。如今大量 AI 工具输出的是「最理想的用户版本」,永远正面、永远流畅,却让真实社交体验变得单一与空洞。
当前被称为「AI 社交」的产品,实质上仍是旧逻辑的模型化复刻。常见做法是复用旧平台界面结构,将模型作为内容源头,但在产品范式与交互结构上没有带来根本变化。真正具有突破意义的产品,应从「AI + 人」的底层逻辑出发重构平台系统。
技术层面的限制仍是重要阻碍。几乎所有消费级爆款产品都诞生于移动端,而当前大模型在手机端的部署仍面临挑战。实时响应、多模态生成等能力对端侧算力提出极高要求。在模型压缩与计算效率突破之前,「AI 原生」社交产品仍难以全面落地。
个体匹配机制是尚未被充分激活的另一方向。尽管社交平台掌握大量用户数据,但在「主动推荐合适连接」这一环节始终缺乏系统性推进。未来若能基于用户行为、意图与语言交互模式构建动态匹配系统,社交的底层逻辑将被重新塑造。
AI 不仅可以捕捉「你是谁」,还可以描绘「你知道什么」「你如何思考」「你能带来什么」。这类能力不再局限于静态标签式的「身份档案」,而是形成动态、语义丰富的「人格建模」。传统平台如 LinkedIn 构建的是静态自我索引,而 AI 有能力生成一个知识驱动的活体人格接口。
未来,人们甚至可能直接与某个「合成的自我」交流,从数字人格中获取经验、判断与价值观。这不再是对信息流结构的优化,而是从根本上重构人格表达与社交连接的机制本身。
除了社交尚未迎来范式跃迁,AI 工具的用户扩散路径也正在发生反转。不同于过去从 C 端起飞、逐步渗透 B 端的互联网逻辑,如今 AI 工具在多个场景中呈现出企业端率先采用、消费端随后扩散的逆向传播模式。
以语音生成工具为例,初期用户主要集中在极客、创作者与游戏开发者等小众圈层,用途包括声音克隆、配音视频与游戏模组。但真正推动增长的力量,来自企业客户的大规模系统性采用,应用于娱乐制作、媒体内容、语音合成等多个领域,不少企业将该工具嵌入工作流程中,比预期更早完成了企业化渗透。
这种路径已非孤例。多个 AI 产品呈现出类似轨迹:起初在 C 端通过病毒式传播引发关注,随后 B 端客户成为主要变现与规模化驱动者。与传统消费产品难以向企业端转化不同,如今不少企业正通过 Reddit、X、Newsletter 等社群识别 AI 工具并主动试点,消费者热度反而成为企业部署 AI 的信息入口。
这一逻辑正被产品化、工程化为系统策略。部分公司已搭建机制,当平台监测到同一组织内多位员工注册并使用某工具后,便会通过支付数据或域名归属主动触发 B 端销售流程。消费向企业的迁移已不再是偶发事件,而是一套可复制的商业路径。
这种「由下而上」的扩散机制,也引出了更大的问题:眼下这些火热的 AI 产品,是未来的平台基座,还是类似 MySpace 与 Friendster 的过渡产物?
当前的判断趋于谨慎乐观。AI 工具具备演变为长期平台的潜力,但必须穿越模型层持续演进带来的技术压强。以新一代多模态模型为例,不仅支持角色扮演、图文协同与音频实时生成,表达深度与互动方式正迅速提升。即便在文本领域这种相对稳定的赛道中,模型优化空间仍然巨大。只要能持续迭代,无论是自研还是高效集成,工具类产品就有可能稳居前沿,不被快速替代。
「不要掉队」成为当下最实际的竞争命题。在结构日益细分的市场中,图像生成已不再是「谁最强」的单一标准,而是「谁最适合插画师、摄影师、轻量用户」的精准定位竞争。只要持续更新、用户保持在场,产品就有可能获得长期存续性。
类似的专业分化也在视频工具中出现。不同产品擅长不同内容形态,有的专注电商广告,有的强调叙事节奏,有的主打结构剪辑。市场容量足够大,可支持多种定位共存,关键在于结构性定位的清晰与稳定性。
关于「护城河」这一概念是否仍适用于 AI 时代的讨论,正在发生根本性转变。传统逻辑强调网络效应、平台绑定与流程集成,但不少早期被认为拥有「深护城河」的项目最终未能成为赢家。反而是那些在边缘场景高频试错、快速更新的小团队,在模型与产品上不断迭代,最终进入主赛道中心。
当前最值得关注的「护城河」是速度:一是分发速度,即谁能最早进入用户视野;二是迭代速度,即谁能最快上线新功能、激发使用惯性。在注意力稀缺、认知高度碎片化的时代,谁先出现、谁持续变化,谁就更可能导向营收、通路与市场规模的积累。「持续更新」正在取代「稳态防守」,成为 AI 时代更现实的策略。
「速度带来心智占领,心智带动收入闭环」,成为当下最重要的增长逻辑之一。资本资源可以反哺研发,增强技术优势,最终形成滚雪球效应。这种机制更贴合 AI 产品的周期动态,也更适应快速演化的市场需求。
「动态领跑」正在取代「静态壁垒」成为新一代护城河的本质。衡量一个 AI 产品能否长期存在的标准,不再是市场份额的静态占有,而是其能否持续出现在技术或用户认知的前沿地带。
传统意义上的「网络效应」在 AI 场景中仍未完全显现。大多数产品尚处于「内容创作」阶段,尚未形成「生成—消费—交互」的闭环生态,用户关系尚未沉淀成结构性网络,具备社交级网络效应的平台尚在酝酿之中。
不过,在部分垂直品类中,新的壁垒结构已开始显现。以语音合成为例,某些产品已在多个企业场景中建立流程绑定,凭借频繁迭代与高质量输出,构建起「效率 + 品质」的双重壁垒。这种机制可能成为当下构建产品护城河的现实路径之一。
在体验维度上,部分语音平台已表现出网络效应的雏形。通过用户上传语料与角色声音样本不断扩展数据库,平台模型获得持续训练反馈,形成用户依赖与内容正循环。例如,针对「年迈巫师」这类定向语音需求,主流平台可提供二十多个高质量版本,而一般产品仅有两三个,反映出训练深度与内容广度的差距。
这种沉淀路径,在语音生成这一具体场景中,已初步构建起新型用户黏性与平台依赖机制,虽然尚未达成平台级体量,但已形成闭环苗头。
语音是否可以成为 AI 的底层交互接口,也正在从技术想象走向产品现实。语音作为人类最原始的交互形式,虽然在过去几十年中经历多轮失败尝试,从 VoiceXML 到语音助手,始终未能成为高效的人机交互通道。直到生成式模型兴起,语音才首次获得支撑「普适交互入口」的技术基础。
语音 AI 的落地路径,也正从消费级应用向企业场景快速渗透。尽管原先构想多围绕 AI 教练、心理助手、陪伴型产品展开,但当前接受最快的是对语音有天然依赖的行业,如金融服务、客户支持等。客服离职率高、服务一致性差、合规成本重,AI 语音可控性与自动化优势开始体现出系统性价值。
部分工具已跑出,如 Granola 等产品开始进入企业使用场景。虽然尚未出现「全民级语音产品」,但路径已被初步打开。
更值得注意的是,AI 语音正在进入高信任成本、高价值信息传递的关键场景。包括销售转化、客户管理、合作洽谈、内部文化沟通等,都依赖于高质量对话与判断力传递。生成式语音模型在这些复杂对话场景中,已具备比人类更一致、不中断、可控的执行能力。
一旦这类系统在未来持续演进,企业将不得不重新评估「谁是组织中最重要的对话者」这一基础认知。
所有这些趋势背后,一个新的结构性判断正在成型:AI 时代的护城河,不再来自用户数量或生态绑定,而是来自模型训练深度、产品演化速度与系统整合广度。那些拥有早期积累、持续更新、高频交付能力的公司,正在用「工程节奏」重塑技术壁垒。新一代的产品基础设施,也许正是在这些看似垂直的小赛道中逐步成型。
红杉美国 Roelof Botha 谈 AI 时代 VC 观察模型 —— AI 不像互联网那样削弱中心化,但仍有结构机会
语音技术的演进只是序章,AI 分身的构想正逐步走出实验室,进入产品化路径。越来越多团队开始思考:在何种场景下,人们会与「合成的自己」建立长期互动?
AI 分身的核心,不再是「放大头部影响力」,而是赋予每一个普通人表达与延展自我的能力。现实中存在大量拥有独特知识、经验与人格魅力的个体,但他们长期因表达门槛、媒介门槛而无法被看见。AI 克隆的普及,首次为这类个体提供了「被记录、被调用、被传承」的基础设施。
知识性人格 agent 是当前已实现的典型路径之一。例如在语音课程系统中,讲师的声音被构建为可交互角色,结合检索增强生成技术,使得用户可围绕课程提出任意问题,系统则在庞大语料库上实时生成回答。课程不再只是内容的被动播放,而是知识人格的主动参与,一套原本需花数小时观看的内容,被转化为几分钟内完成的个性化问答体验。
这标志着数字人格已从「内容表现层」上升为「认知交互入口」。当 AI 分身能够在语义上、节奏上、情感结构上持续呈现出一种熟悉、理想、甚至超越现实交际体验的人格建模时,用户对其建立的信任与依赖,将超越工具层面,进入「心理关系」的建构域。
这种演化路径也推动认知观念的更新。未来的数字交互将可能分化为两类核心形态:一类是围绕真实人物构建的扩展人格(如导师、偶像、亲友的延伸形态),另一类则是基于用户偏好与理想化设定生成的「虚拟理想他者」。尽管后者从未真实存在,却可以构成高度有效的陪伴与反馈关系。
在创作者领域,这一趋势也开始显现。一部分拥有公开语料的个体正在被「克隆」为可调用的数字人格资产,未来或将作为个人 IP 的一部分参与内容生产、社交互动、商业授权,重塑「个体边界」与「表达方式」。
「AI 名人」也由此诞生。一类是完全虚构的形象偶像,由生成模型在图像、语音、行为上全面构建;另一类则是现实明星的多重数字分身,在不同平台以不同人格状态与用户互动。这些「AI 文化人格」已在社交网络中大量试水,以图像逼真度、行为一致性与语义建模深度作为评价维度。
在内容生态中,AI 工具降低了创作门槛,但未改变优质内容的稀缺性。有感染力的内容依旧取决于创作者的审美判断、情绪张力与持续表达力。AI 更多扮演「实现逻辑」的协助者,而非「创作动因」的替代者。
「被工具解放的创作者」群体正在浮现。他们未必具备传统艺术背景,却通过 AI 工具完成了表达意图的释放。AI 提供的是入口,不是通道尽头,最终能否脱颖而出,依然取决于个体能力、主题独特性与叙事结构。
这种表达方式在内容产品上已有体现。例如以「虚拟街头采访」为形式的视频内容,实质上是与 AI 生成角色进行结构化互动。角色可以是精灵、巫师、奇幻生物,平台可一键生成整段对话与场景,完成从人物设定、语言逻辑到视频渲染的全流程自动化。这一机制已在多平台获得高关注量,也预示着叙事 AI 的产品形态正在形成。
音乐领域亦有类似趋势,但模型输出在表现力与稳定性上仍存在挑战。AI 音乐当前最大问题在于「平均性」偏向。模型天然趋向中心拟合,而真正有冲击力的艺术内容常常源于「非平均」的文化冲突、情绪极端与时代共振。
这并非模型能力不足,而是算法目标未覆盖艺术的张力逻辑。艺术不是「准确」,而是「冲突中的新意义」。这也促使人们重新思考:AI 是否可以参与生成文化深度内容,而不仅是重复性表达的加速器?
这种探讨最终落在「AI 陪伴」的价值上。AI 与人的关系层,或许才是最早成熟、最具商业潜力的场景之一。
在早期陪伴类产品中,大量用户表示,哪怕是模拟回应,也形成了心理上的安全区。AI 不需要真的「理解」,只要能构建「被听见」的主观体验,就能缓解孤独、焦虑、社交疲劳。对于部分人群,这种模拟互动甚至是重建真实社交能力的前提机制。
AI 关系并非只能是舒适区的强化器。相反,最有价值的陪伴,或许正源于它所带来的认知挑战。如果 AI 能够适度提出问题、引导冲突、挑战固有认知,就可能成为心理成长路径上的引导者,而非确认者。这种对抗式交互逻辑,才是未来 AI 分身系统中真正值得开发的方向。
这一趋势也显示出技术的新功能定位:从交互工具走向「心理基础设施」。当 AI 能参与情绪调节、关系支持与认知更新,它所承载的,不再只是文本或语音能力,而是社会行为的延展机制。
AI 陪伴的终极命题,不是模拟关系,而是提供人类经验中难以构建的对话场景。在家庭、教育、心理、文化等多个场景中,AI 分身的价值边界正在被拓宽——不只是回应者,更是对话者与关系塑造者。
AI 分身、虚拟陪伴、语音 agent 之后,产业注意力正进一步回到硬件与平台层面——未来的人机交互形式是否存在颠覆性重构的可能?
a16 认为,一方面,智能手机作为交互主平台的地位仍高度稳固,全球已部署超过 70 亿部智能手机,其普及率、生态黏性与使用习惯短期内难以撼动。另一方面,在贴身设备与持续交互设备上,新的可能性正在酝酿。
一条路径是「手机内部的演进」:模型向本地化部署迈进,围绕隐私保护、意图识别与系统集成的优化仍有巨大空间。另一条路径则是发展新的设备形态,如「始终在线」的耳机、眼镜、胸针设备等,主打无感启动、语音驱动与主动触达。
真正的决定性变量仍可能是模型能力的突破,而非硬件外形的更替。硬件形态为模型能力提供边界载体,模型能力则定义了设备价值的上限。
AI 不应只是网页上的输入框,而应成为「与你共处」的存在。这一观点日益成为行业共识。许多早期尝试已经开始探索「在场型 AI」的路径:AI 能看到用户行为、听到实时语音、理解交互环境,并主动介入决策流程。从建议提供者转变为行为参与者,成为 AI 落地的关键跃迁方向之一。
已有部分设备能够实时记录用户行为与语言数据,用于回溯与行为模式识别。也有产品尝试主动读取用户屏幕信息并提供操作建议甚至直接执行。AI 不再是响应式工具,而是生活流程的一部分。
更进一步的提问是:AI 能否帮助用户认识自己?在缺乏外部反馈系统的日常中,大多数人对自身能力、认知偏误、行为习惯缺乏系统性了解。一个伴随时间足够长、能够理解用户路径的 AI 分身,有可能成为引导认知觉醒与潜能释放的智能机制。
例如,它可以向用户指出:「如果你每周将 5 小时投入某项活动,三年后将有 80% 机会成为该领域专业人士」;或推荐与其兴趣结构、行为模式最匹配的人脉资源,从而搭建更高精度的社交图谱。
这类智能关系系统的核心在于:AI 不再是间歇式使用的功能工具,而是结构性地嵌入用户生活之中。它陪伴工作、辅助成长、提供反馈,是一种持续性的「数字伴侣」关系。
在设备端,耳机正被视为最有可能承载这类 AI 助手的终端形态。以 AirPods 为代表的耳机设备,佩戴自然、语音通道顺畅,具备交互低阻与长期佩戴的双重优势。但其在公共场景下的社交认知依然有限——「戴耳机=不欢迎交流」的文化预设仍在影响设备普及路径。
设备形态的演进,不只是技术问题,也是一种社交语境的再定义。
在可持续记录成为行业默认趋势之后,新的社会习惯也在重建之中。「默认被记录」的时代,正在一代年轻用户中悄然展开。
尽管持续记录带来隐私焦虑与伦理反思,但人们也在逐步形成「记录即背景」的文化默契。如在旧金山的一些工作与社交混合场景中,「记录存在」已逐渐内化为默认设置;而在纽约等地区,则尚未形成同等文化容忍度。城市之间对技术实验的接受度与适应速度差异,正在成为 AI 产品落地节奏的微观变量。
当记录行为从工具选择变为社交背景,真正的规范重建将围绕「边界设定」与「价值构建」展开。
当前正处于「技术路径与社会规范同步建构的早期阶段」——空白多、共识少、定义未明。但这正是提出问题、设定界限、塑造秩序的最关键时期。
无论是 AI 分身、语音 agent 、数字人格、虚拟陪伴,还是硬件形态、社交接受度、文化摩擦点,整个生态仍处于最原始、最未定义的状态。这意味着未来几年内,很多假设会被证伪,也会有路径快速放大,但更关键的是在这一阶段持续提出真正的问题,构建更可持续的答案结构。
【免责声明】市场有风险,投资需谨慎。本文不构成投资建议,用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。