Perplexity 如何选择来源-以及如何成为来源之一

由 ICODA AI 可见性研…

Published: 26 4 月, 2026

1 minute to read

CMO

标签:

Perplexity SEO并不是披上新外衣的传统 SEO。它是一项与众不同的运动-在这项运动中，每个答案都被编号引用，大约一半的引用内容是在过去 12 个月内发布的，一个 Reddit 线程的排名就能超过价值 5 万美元的支柱页面。要想在 Perplexity 中获胜，你就不能追逐排名第一的位置。你要竞争成为引擎实际引用的四五个来源之一。

为了了解这种选择在实践中是如何发挥作用的，ICODA 的研究团队对 50 个真实的 Perplexity 查询进行了分析，这些查询涉及 SaaS、金融技术、加密货币和数字营销。我们记录了每一个被引用的 URL，并按照域名类型、新鲜度、结构和谷歌重叠度进行了分类。结果发现了一个清晰、可重复的模式，即什么会被引用，什么会被忽略，以及杠杆点在哪里。

Perplexity 与 ChatGPT 和 Google 的工作原理有何不同？

Perplexity 是一个混合体：前端是搜索引擎，后端是生成模型。ChatGPT 依靠的是预先训练好的（"参数"）记忆，而 Perplexity 则不同，它会对每个查询进行实时网络检索，并通过内联引文合成答案。与谷歌不同，它不会给你十个蓝色链接，而是给你一个段落和一个脚注栏。

Perplexity、ChatGPT 和 Google 在检索方法、引用行为、每个答案的来源、新鲜度权重、索引大小和最强内容类型方面的比较表。Perplexity 采用实时网络检索，始终显示引用信息，每个答案引用约 5 个来源，新鲜度权重高，索引了约 2000 亿个 URL，对问答和新鲜数据的处理能力最强。

Perplexity 采用检索增强生成技术（RAG）和三层重排管道：

第 1 层 - 初始检索：BM25 关键字匹配与语义嵌入相结合，在约 2,000 亿个 URL 的索引中广泛撒网。
第 2 层-跨编码器重排：系统联合评估查询-文档对，以提高相关性。
第 3 层-ML ranker（基于 XGBoost）：根据实体清晰度、域名权威性、新鲜度和来源多样性进行最终过滤。

Perplexity 的三层重排管道示意图：在引用 4-5 个来源之前，查询会经过 BM25 加嵌入、相关性交叉编码器和 XGBoost ML 重排器。

结果是残酷的。根据BrightEdge的数据，Perplexity每次查询大约会访问10个页面，但只引用3-5个页面-平均每次查询引用5.28个页面。这使得引用的门槛远高于进入谷歌前100名。你必须入围。

Perplexity 引用漏斗：索引中的 2,000 亿个 URL 缩小到每次查询大约 10 页，而最终答案中只有 4-5 个引用为来源。

我们的分析：50 项查询，250 多条引用来源

在我们记录的50次查询中，Perplexity返回了250多条独特的引用信息。这些模式与 BrightEdge、Search Atlas 和 Seer Interactive 的大型公开研究密切相关，但它们比标题数字所显示的更引人注目。

信号	我们观察到的情况	对您的意义
每个答案的引文	4-6 个来源，平均 ~5 个	你要竞争的是五个名额，而不是十个
谷歌重叠（域）	~60% 的引用域名也排在 Google 第 1 页	强大的传统 SEO 仍是基础
谷歌重叠 (URL)	只有 ~28% 是准确的 Google 前十名页面	经常使用相同的域名，但引用的页面不同
新鲜度	~50% 的引用是 2025 内容	静态页面迅速失去地位
来源组合	~35% 新闻/媒体，~25% 品牌所有，~20% 社区（Reddit、LinkedIn、论坛），~15% 评论/市场，~5% 文档和政府	单一渠道的 SEO 无法满足您的需求
引用段落的位置	~44% 来自文章的前 30	以答案为导向，而不是背景故事

条形图显示了 ICODA 对 50 个查询进行分析后得出的 Perplexity 来源分布情况：新闻和媒体占 35%，品牌自有内容占 25%，Reddit 和 LinkedIn 等社区来源占 20%，评论和市场占 15%，文档和政府占 5%。

主要发现Perplexity对许多与谷歌相同的域进行了奖励，但它会从这些域中挑选不同的页面，而且对新鲜度的权重要高得多。此外，它还能从第三方验证（Reddit、G2、LinkedIn、行业媒体）中获取信息，而传统的谷歌搜索还做不到这一点。

Perplexity 引用的首要排名因素

被引用的最强预测因素大致依次为新鲜度、结构清晰度、第三方权威性和实体丰富度。反向链接和纯域权威仍然重要，但它们与被引用的相关性不大。而具体、量化的主张则与引用密切相关。

具体地说，就是什么能起到作用：

新鲜信号 Perplexity的Sonar模型偏爱时间戳较新的内容。一半的Perplexity引用来自当年发布的内容。行业测试表明，即使是微小的编辑-刷新一个数据、更新一个例子-也能将时间敏感性查询的引用频率提高约三分之一。
结构化内容。 问答格式、对照表、定义块和紧凑的项目符号列表的效果明显优于密集的段落。具有适当模式标记（文章、常见问题、HowTo）的页面被引用的可能性要高出约 28%。
第三方提及。 在 Reddit、Quora、LinkedIn 和行业出版物上出现的品牌比那些只在自己域名上发布信息的品牌更容易被引用。SE Ranking 发现，被社区广泛提及的域名在人工智能引用中出现的几率大约是其他域名的 4 倍。
作者和实体信号。 带有链接的作者简介、组织架构和一致的姓名-地址-电话数据为 Perplexity 的 E-E-A-T 评估提供了信息。
量化特异性。 "2025 年市场增长 23%"每次都比 "市场增长强劲 "更胜一筹。Perplexity 的 ranker 会奖励那些可以作为铁的事实来提炼的内容。

技术：Perplexitybot 访问和抓取频率

如果 PerplexityBot 无法访问您的网站，那么所有的内容工作都将变得毫无意义。Perplexity运行着两种不同的爬虫，它们做着不同的工作：

PerplexityBot- 索引爬虫。建立长期索引，为引用答案提供动力。识别为 Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; PerplexityBot/1.0; +https://perplexity.ai/perplexitybot)
Perplexity-User- 实时、按需抓取器。当真实用户提问，系统需要实时抓取页面时触发。它的行为与传统爬虫不同，不受 robots.txt 逻辑的约束。

封锁一个，就会削弱另一个。如果两个都被屏蔽，那么你实际上就消失了-除了从第三方引文中摘取的标题和领域摘要。

值得注意的几个技术现实问题：

IP 允许列表：Perplexity 在perplexitybot.json 和perplexity-user.json 上公布了其僵尸 IP 范围。在配置 Cloudflare 或 AWS WAF 规则时使用这些规则。
抓取频率：PerplexityBot 由事件驱动，而不是日历驱动。受欢迎的、定期更新的网页可以在几小时内被重新抓取；而无用的内容可能要等上几周。
渲染很重要：Perplexity 更喜欢服务器端渲染的 HTML。隐藏在大量客户端 JavaScript 后面的核心答案往往无法被解析器找到。
隐形爬虫争议：2024-2025 年，Cloudflare 公开指责 Perplexity 使用未声明的用户代理绕过站点级禁止抓取指令。如果您配置了严格的僵尸规则，请仔细检查是否有意识地允许或阻止已声明的代理。

ICODA 的人工智能可见性检查器的作用

大多数团队发现人工智能可视性问题时已经晚了六个月。ICODA 的免费 Perplexity SEO 工具可对八个重要的人工智能爬虫（包括 PerplexityBot 和 Perplexity-User）进行实时审计，并返回一个单一的仪表板，显示：

爬虫访问：在 robots.txt、CDN 或 WAF 层面阻止了哪些人工智能机器人的访问

结构得分：最高意向页面的可提取程度（标题深度、答案优先格式、列表密度）

模式覆盖范围：文章、FAQ、HowTo 和组织模式是否存在且有效

引用足迹：您的域名目前在 Perplexity、ChatGPT、Gemini 和 AI Overviews 中的出现位置

在您的域上运行检查 →

内容：Perplexity 更喜欢什么格式的引文？

Perplexity 更喜欢答案优先、事实密集、机器可提取的内容，而不是叙事性的故事。在我们的 50 个查询样本中，获得引用率最高的格式始终如一：

比较和 "对比 "页面，有清晰的表格和明确的判断
用两到四句话解决一个概念的定义和词汇条目
带有编号、独立步骤的操作指南
列表和 "最佳 "综述，注明选择标准
原始数据页面-调查、基准、专有研究、年度回顾报告
新闻和带有时间戳的更新，"最后更新 "标记清晰可见

双栏内容格式参考 Perplexity 引用与忽略。引用：比较和 "对比 "页面、定义和词汇表、操作指南、附带标准的 "最佳 "列表文章、原始数据和基准。忽略：单薄的宣传页面、没有数据的思想领袖、多意图登陆页面、JavaScript 封装的内容、过时和未注明日期的内容。

Perplexity倾向于忽略的内容：内容单薄的宣传页面、没有数据的纯粹思想领袖文章、试图同时完成五项工作的多目标登陆页面，以及任何隐藏在繁重的JavaScript或身份验证后面的内容。

我们不断看到的结构规则是：可引用段落是简短、自足和可引用的。如果范文能从你的页面中提取出两句话，而且这两句话在没有上下文的情况下也是有意义的，那么你就拥有了一个可引用的段落。如果你的答案被埋没在第六段中，那么它实际上就不存在。

行动计划：获得引用的 5 个步骤

按影响程度从大到小排列的实用顺序：

首先审核机器人的访问。检查 robots.txt、WAF 规则以及PerplexityBot 和Perplexity-User 的访问日志。没有访问，就没有引用，再多的内容投资也无济于事。
重构你的最高意向页面，以便提取。 在折页上方用两到四句话直接回答问题。添加对比或定义块。写出与真实提示措辞一致的 H2（"X 如何工作？"、"X 与 Y 的对比"、"Y 的最佳 X"）。
在编辑日历中加入新鲜元素。 标注可见的 "最后更新 "日期。每季度用新数据、截图和日期示例刷新首页。即使是很小的编辑也能重置 Perplexity 的新鲜度信号。
建立第三方引用。 在 Reddit、LinkedIn、G2、Capterra 和行业媒体上获得真实而非宣传性的提及。Perplexity 将社区验证和赢得的媒体作为主要的信任信号，而不是锦上添花。
使用 Perplexity SEO 跟踪器跟踪引文。 人工检查无法超出少数提示的范围。ICODA 的人工智能可见性平台可以监控哪些提示引用了您的域名、竞争对手在哪些方面赢得了引用、哪些格式转换成了实际的推荐流量，以及您的引用足迹每周如何变化-跨 Perplexity、ChatGPT、Gemini 和 Google AI Overviews。

经过精心优化的内容开始出现在成熟域名的 Perplexity 引用中通常需要 2 到 4 周的时间，这比传统的 SEO 快得多，但前提是技术和结构基础到位。

从诊断开始，而非内容冲刺

利用率最高的第一招不是 "我们有排名吗？而是 "机器人能否访问我们的网页？如果PerplexityBot或Perplexity-User在WAF、CDN或robots.txt层被阻止，那么其他所有Perplexity SEO投资都将从零开始。我们已经对谷歌排名靠前、编辑日历齐全、Perplexity可见度为零的域名进行了审核-每次，失败都发生在访问层，而不是内容层。

运行ICODA的AI可见性检查器（可作为Perplexity SEO跟踪器进行持续监测），以准确了解哪些AI爬虫会访问您的网站、您的结构在哪些方面得分较高、您的引文足迹在哪些方面已经存在。这项检查是免费的，只需不到一分钟的时间，并返回我们的分析师在企业审计中使用的诊断结果。

2026年出现在 "Perplexity "上的品牌，都是将其作为一个独立的渠道来对待，有自己的规则。而那些不这样做的品牌，仍然在为搜索结果页面做优化，而越来越多的人却不去阅读搜索结果页面。

常见问题（FAQ）

Perplexity SEO 只是换了个名字的普通 SEO 吗？

Perplexity SEO 在结构上不同于谷歌 SEO。谷歌的排名是十页；而 Perplexity 则是在一个综合答案中引用 4-6 个来源。您不是在竞争排名，而是在竞争入围名单。域名权重仍然重要，但内容格式和新鲜度的权重要高得多。

我的网站在 Google 上有排名，但没有出现在 Perplexity 中。

最常见的原因是您不知道的技术封锁。Perplexity运行两个爬虫-PerplexityBot和Perplexity-User，许多Cloudflare或WAF配置会静默地阻止其中一个或两个。请专门检查您的 robots.txt 和访问日志中的这些代理。如果机器人无法访问您的网页，那么强大的 Google 排名就毫无意义。

Perplexity 挑选信息源的方式与谷歌有何不同？

Perplexity 对新鲜度的权重远高于谷歌。大约一半的引用来自当年发布的内容。一篇在2019年排名靠前的常青文章很可能会被完全跳过。第三方社区内容-Reddit、G2、LinkedIn-也会以传统 SEO 无法估量的速度被引用。

为什么 Perplexity 一直引用 Reddit 而不是品牌官方网页？

在大规模查询研究中，社区内容约占Perplexity引用量的20%。Perplexity将同行验证视为主要的信任信号，而不是次要信号。如果您的品牌没有在论坛和评论平台上得到真实的讨论，那么您就失去了一个真正的引用渠道，而不是一个锦上添花的东西。

优化后需要多长时间才能出现在 Perplexity 中？

一旦技术访问得到确认，对于已建立的域名来说，2 至 4 周的时间是现实的。瓶颈几乎从来不是内容质量-几乎总是爬行器受阻或答案在页面结构中埋藏太深。首先解决访问和结构问题，然后再完善内容。

schema 标记是否真的会影响 Perplexity 引用？

根据大规模的研究，带有文章、常见问题或 HowTo 模式的页面被引用的可能性要高出大约 28%。模式对Perplexity的排序器来说是结构清晰的信号，而不是装饰性的。它是对已经优化的内容进行的效率最高的低成本改进之一。