Perplexity가 소스를 선택하는 방법과 소스가 되는 방법

ICODA AI 가시성 연구팀에 의한 분석. 방법론: 2026년 3월에 50개의 상업용 쿼리를 Perplexity를 통해 실행하고,…

Published: 4월 26, 2026

1 minute to read

CMO

태그:

Perplexity SEO는 새로운 페인트칠을 한 전통적인 SEO가 아닙니다. 모든 답변이 번호가 매겨진 인용문으로 포장되고, 인용된 콘텐츠의 약 절반이 지난 12개월 동안 게시되었으며, Reddit 스레드 하나가 5만 달러짜리 기둥 페이지보다 높은 순위를 차지할 수 있는 다른 스포츠와 같은 것입니다. Perplexity에서 우승하려면 1위를 쫓아서는 안 됩니다. 엔진이 실제로 인용하는 4~5개의 소스 중 하나가 되기 위해 경쟁해야 합니다.

이러한 선택이 실제로 어떻게 작동하는지 파악하기 위해 ICODA의 연구팀은 SaaS, 핀테크, 암호화폐, 디지털 마케팅을 아우르는 50개의 실제 Perplexity 쿼리를 분리해냈습니다. 인용된 모든 URL을 기록하고 도메인 유형, 최신성, 구조 및 Google 중복 여부에 따라 분류했습니다. 그 결과, 무엇이 인용되고 무엇이 무시되는지, 그리고 어디에 레버리지 포인트가 있는지에 대한 명확하고 반복 가능한 패턴이 나타났습니다.

Perplexity가 ChatGPT 및 Google과 다르게 작동하는 방식

Perplexity는 검색 엔진 프런트엔드에 생성 모델을 탑재한 하이브리드형 솔루션입니다. 사전 학습된(‘파라메트릭’) 메모리를 활용하는 ChatGPT와 달리, Perplexity는 모든 쿼리에 대해 실시간 웹 검색을 실행하고 인라인 인용을 통해 답변을 합성합니다. Google과 달리 10개의 파란색 링크를 제공하는 것이 아니라 하나의 문단과 각주 표시줄을 제공합니다.

검색 방식, 인용 방식, 답변당 출처, 최신성 가중치, 인덱스 크기, 가장 강력한 콘텐츠 유형에 따른 Perplexity, ChatGPT, Google의 비교 표입니다. Perplexity는 실시간 웹 검색을 사용하고, 항상 인용을 표시하며, 답변당 약 5개의 소스를 인용하고, 최신성 가중치가 높고, 약 2,000억 개의 URL을 색인하며, Q&A 및 최신 데이터에 가장 강합니다.

내부적으로 Perplexity는 3계층 재랭크 파이프라인과 함께 검색 증강 생성(RAG)을 사용합니다:

레이어 1 - 초기 검색: 시맨틱 임베딩과 결합된 BM25 키워드 매칭은 약 2,000억 개의 URL 인덱스에 걸쳐 광범위한 그물망을 형성합니다.
레이어 2 - 교차 인코더 재순위 지정: 시스템이 쿼리-문서 쌍을 공동으로 평가하여 관련성을 강화합니다.
레이어 3 - ML 리랭커(XGBoost 기반): 엔티티 명확성, 도메인 권한, 최신성 및 소스 다양성을 기준으로 최종 필터링합니다.

Perplexity의 3계층 리랭크 파이프라인 다이어그램: 쿼리는 BM25와 임베딩, 정확도를 위한 크로스 인코더, 그리고 4~5개의 소스가 인용되기 전에 XGBoost ML 리랭커를 통과합니다.

그 결과는 가혹합니다. Perplexity는 쿼리당 약 10페이지를 방문하지만 인용은 3~5개에 불과하며, 응답당 평균 인용 횟수는 5.28회라고 BrightEdge는 말합니다. 이는 Google의 상위 100위 안에 드는 것보다 훨씬 높은 인용 수입니다. 최종 후보에 올라야 합니다.

Perplexity 인용 퍼널: 색인에 있는 2천억 개의 URL이 쿼리당 약 10페이지로 좁혀지고 최종 답변에 출처로 인용되는 것은 4~5개에 불과합니다.

분석: 50개의 쿼리, 250개 이상의 인용 출처

50개의 쿼리 전체에 걸쳐 Perplexity는 250개 이상의 고유 인용을 반환했습니다. 이러한 패턴은 브라이트엣지, 서치 아틀라스, 시어 인터랙티브의 대규모 공개 연구와 거의 일치했지만, 헤드라인의 숫자가 시사하는 것보다 훨씬 더 두드러졌습니다.

신호	관찰한 내용	사용자에 대한 의미
답변당 인용	4~6개의 소스, 평균 ~5개	10자리가 아닌 5자리를 놓고 경쟁하는 것입니다.
Google 중복(도메인)	인용된 도메인의 ~60%도 Google 페이지 1위에 랭크됩니다.	강력한 전통적 SEO는 여전히 기반입니다.
Google 오버랩(URL)	28%만이 정확한 Google 상위 10위 페이지입니다.	동일한 도메인이 자주 인용되는 다른 페이지
신선도	인용의 ~50%는 2025년 콘텐츠였습니다.	정적 페이지가 빠르게 사라짐
소스 믹스	뉴스/미디어 ~35%, 브랜드 소유 ~25%, 커뮤니티(Reddit, LinkedIn, 포럼) ~20%, 리뷰/마켓플레이스 ~15%, 문서 및 정부 ~5%입니다.	단일 채널 SEO로는 한계가 있습니다.
인용된 구절 위치	~44%는 기사의 첫 30%에서 발생했습니다.	뒷이야기가 아닌 답으로 리드하기

50개의 쿼리에 대한 ICODA의 분석에서 Perplexity 소스 분포를 보여주는 막대 차트: 뉴스 및 미디어 35%, 브랜드 소유 콘텐츠 25%, Reddit 및 LinkedIn과 같은 커뮤니티 소스 20%, 리뷰 및 마켓플레이스 15%, 문서 및 정부 5%.

헤드라인 검색 결과: Perplexity는 Google과 동일한 도메인에 대해 많은 보상을 제공하지만, 이러한 도메인과는 다른 페이지를 선택하고 훨씬 더 적극적으로 새로움에 가중치를 부여합니다. 또한 기존 Google 검색이 제공하지 않는 수준에서 타사 검증(Reddit, G2, LinkedIn, 무역 언론)을 활용합니다.

Perplexity 인용의 상위 순위 요인

인용될 확률을 가장 강력하게 예측하는 요소는 최신성, 구조적 명확성, 제3자 권한, 엔티티의 풍부성 순입니다(대략 이 순서대로). 백링크와 순수 도메인 권한도 여전히 중요하지만 인용과 어느 정도만 상관관계가 있습니다. 구체적이고 정량화된 주장은 강한 상관관계가 있습니다.

구체적으로 살펴보면 다음과 같습니다:

신선도 신호. Perplexity의 소나 모델은 최근 타임스탬프가 있는 콘텐츠를 선호합니다. 모든 Perplexity 인용의 절반은 올해에 게시된 콘텐츠에서 발생합니다. 업계 테스트에 따르면 통계를 새로 고치거나 예시를 업데이트하는 등 사소한 수정만으로도 시간에 민감한 쿼리의 인용 빈도가 약 1/3까지 상승할 수 있는 것으로 나타났습니다.
구조화된 콘텐츠. Q&A 형식, 비교표, 정의 블록, 빽빽한 글머리 기호 목록은 밀도가 높은 단락보다 훨씬 더 높은 성과를 냅니다. 적절한 스키마 마크업(문서, FAQ, 방법)이 있는 페이지는 인용될 확률이 약 28% 더 높습니다.
타사 멘션. Reddit, Quora, LinkedIn, 무역 간행물 등에 표시되는 브랜드는 자체 도메인에만 게시하는 브랜드보다 훨씬 더 자주 인용됩니다. SE Ranking은 커뮤니티에서 광범위하게 언급된 도메인이 AI 인용에 노출될 가능성이 약 4배 더 높다는 사실을 발견했습니다.
작성자 및 엔티티 신호. 연결된 약력, 조직 스키마 및 일관된 이름-주소-전화 데이터를 갖춘 네임드 작성자는 Perplexity의 E-E-A-T 평가에 반영됩니다.
정량화된 특이성. "2025년 시장은 23% 성장했다"가 "시장이 크게 성장했다"를 매번 앞섰습니다. Perplexity의 리랭커는 확실한 사실로 인정받을 수 있는 콘텐츠에 보상을 제공합니다.

기술: 퍼플렉서티봇 액세스 및 크롤링 빈도

퍼플렉서티봇이 사이트에 도달할 수 없다면 콘텐츠 작업은 아무런 의미가 없습니다. Perplexity는 서로 다른 두 개의 크롤러를 실행하며, 각 크롤러는 서로 다른 작업을 수행합니다:

퍼플렉서티봇 - 인덱싱 크롤러. 인용된 답변을 뒷받침하는 장기적인 인덱스를 구축합니다. 로 식별됩니다: Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; PerplexityBot/1.0; +https://perplexity.ai/perplexitybot)
Perplexity-User - 실시간 온디맨드 페처. 실제 사용자가 질문을 하고 시스템이 실시간으로 페이지를 가져와야 할 때 트리거됩니다. 의도적으로 기존 크롤러처럼 동작하지 않으며 동일한 robots.txt 로직에 구속되지 않습니다.

한 쪽을 차단하면 다른 쪽에도 핸디캡이 적용됩니다. 둘 다 차단하면 타사 인용문에서 가져온 얇은 헤드라인 및 도메인 요약을 제외하고는 사실상 사라집니다.

몇 가지 기술적 현실에 주목할 필요가 있습니다:

IP 허용 목록: Perplexity는 봇 IP 범위를 perplexitybot.json 및 perplexity-user.json 에 게시합니다. Cloudflare 또는 AWS WAF 규칙을 구성할 때 이를 사용하세요.
크롤링 빈도: 퍼플렉서티봇은 캘린더 중심이 아닌 이벤트 중심입니다. 인기 있고 정기적으로 업데이트되는 페이지는 몇 시간 내에 다시 크롤링할 수 있으며, 고아 콘텐츠는 몇 주가 걸릴 수 있습니다.
렌더링이 중요합니다: Perplexity는 서버 측 렌더링 HTML을 선호합니다. 무거운 클라이언트 측 자바스크립트 뒤에 숨겨진 핵심 답변은 종종 구문 분석기에 도달하지 못합니다.
스텔스 크롤러 논란: 2024~2025년, Cloudflare는 신고되지 않은 사용자 에이전트를 사용하여 사이트 수준의 크롤링 금지 지시어를 우회하는 Perplexity를 공개적으로 비난했습니다. 엄격한 봇 규칙을 구성한 경우, 선언된 에이전트를 모두 의식적으로 허용하거나 차단하고 있는지 다시 확인하세요.

ICODA의 AI 가시성 검사기 기능

대부분의 팀은 AI 가시성 문제를 6개월이 지나서야 발견합니다. ICODA의 무료 Perplexity SEO 도구는 중요한 8개의 AI 크롤러(PerplexityBot 및 Perplexity-User 포함)에 대해 실시간 감사를 실행하고 단일 대시보드 표시를 반환합니다:

크롤러 액세스: robots.txt, CDN, WAF 수준에서 차단되는 AI 봇: 어떤 봇이 차단되나요?

구조 점수: 가장 의도가 높은 페이지를 추출할 수 있는 정도(제목 깊이, 답변 우선 서식, 목록 밀도)

스키마 적용 범위: 문서, FAQ, 사용법 및 조직 스키마의 존재 및 유효성 여부

인용 발자국: 현재 Perplexity, ChatGPT, Gemini 및 AI 개요에서 도메인이 표시되는 위치

도메인에서 확인 실행 →

콘텐츠: Perplexity는 어떤 형식의 인용을 선호하나요?

Perplexity는 내러티브 스토리텔링이 아닌 답변 위주의 사실 밀도 높은, 기계 추출이 가능한 콘텐츠를 선호합니다. 50개의 쿼리 샘플에서 가장 일관되게 인용을 많이 받은 형식은 다음과 같습니다:

명확한 표와 명시적인 판결이 있는 비교 및 ‘대’ 페이지
개념을 2~4문장으로 정리한 정의 및 용어집 항목
번호가 매겨진 독립된 단계가 포함된 방법 가이드
선정 기준이 명시된 목록 및 ‘베스트 오브’ 모음집
원본 데이터 페이지 - 설문조사, 벤치마크, 독점 연구, 연도별 리뷰 보고서
‘마지막 업데이트’ 표시가 있는 뉴스 및 타임스탬프가 표시된 업데이트

콘텐츠 형식의 두 열 참조 Perplexity 인용과 무시. 인용: 비교 및 '비교' 페이지, 정의 및 용어집, 사용 방법 가이드, 기준이 있는 '베스트 오브' 목록, 원본 데이터 및 벤치마크. 무시됨: 얇은 홍보 페이지, 데이터가 없는 사고 리더십, 다중 의도 랜딩 페이지, 자바스크립트 게이트 콘텐츠, 오래되고 날짜가 표시되지 않은 콘텐츠.

얇은 홍보 페이지, 데이터가 없는 순수한 사고 리더십 에세이, 한 번에 5가지 작업을 수행하려는 다중 의도 랜딩 페이지, 무거운 자바스크립트나 인증 뒤에 가려진 모든 것 등 Perplexity가 무시하는 경향이 있는 것들입니다.

인용 가능한 구절은 짧고, 독립적이며, 인용 가능한 구절이라는 구조적 규칙이 계속 확인되었습니다. 모델이 페이지에서 두 문장을 가져올 수 있고 문맥 없이도 의미가 있다면 인용 구절이 있는 것입니다. 답변이 6단락에 묻혀 있다면 사실상 답변이 없는 것입니다.

실행 계획: 인용되기 위한 5단계

영향력이 큰 순서대로 실용적인 순서입니다:

먼저 봇 액세스를 감사하세요. PerplexityBot 및 Perplexity-User 에 대한 robots.txt, WAF 규칙 및 액세스 로그를 확인합니다. 접근이 없으면 인용도 없고, 아무리 많은 콘텐츠를 투자해도 문제가 해결되지 않습니다.
추출할 의도가 가장 높은 페이지를 재구성하세요. 접힌 부분 위에 2~4문장의 직접 답안으로 유도합니다. 비교 또는 정의 블록을 추가합니다. 실제 프롬프트 문구("X는 어떻게 작동하나요?", "X 대 Y", "Y에 가장 적합한 X")를 반영하는 H2를 작성합니다.
편집 캘린더에 신선함을 불어넣으세요. ‘마지막 업데이트’ 날짜에 스탬프를 찍습니다. 새로운 데이터, 스크린샷, 날짜가 표시된 예시로 분기별로 상위 페이지를 새로 고칩니다. 작은 수정 사항도 Perplexity의 최신성 신호를 초기화할 수 있습니다.
타사 인용을 구축하세요. Reddit, LinkedIn, G2, Capterra 및 무역 언론에서 홍보용이 아닌 진정성 있는 언급을 받으세요. Perplexity는 커뮤니티의 검증과 획득한 미디어를 호감이 아닌 주요 신뢰 신호로 취급합니다.
Perplexity SEO 트래커로 인용을 추적하세요. 수동 확인은 몇 가지 프롬프트 이상으로 확장되지 않습니다. ICODA의 AI 가시성 플랫폼은 어떤 프롬프트가 귀하의 도메인을 인용하는지, 경쟁업체가 인용을 획득하고 있는지, 어떤 형식이 실제 추천 트래픽으로 전환되는지, 그리고 귀하의 인용 공간이 매주 어떻게 변화하는지를 Perplexity, ChatGPT, Gemini 및 Google AI 오버뷰를 통해 모니터링합니다.

잘 최적화된 콘텐츠가 기존 도메인의 Perplexity 인용에 표시되기 시작하는 데 걸리는 일반적인 기간은 2~4주이며, 이는 기존 SEO보다 훨씬 빠르지만 기술 및 구조적 기반이 갖춰진 경우에만 가능합니다.

콘텐츠 스프린트가 아닌 진단으로 시작하기

가장 먼저 고려해야 할 사항은 "순위를 매길 수 있는가?"가 아닙니다. "봇이 우리 페이지에 도달할 수 있는가?"입니다. 퍼플렉시티봇 또는 퍼플렉시티 유저가 WAF, CDN 또는 robots.txt 레이어에서 차단되는 경우, 다른 모든 퍼플렉시티 SEO 투자는 0에서 시작됩니다. Google은 강력한 Google 순위, 전체 편집 캘린더, Perplexity 가시성이 전혀 없는 도메인을 감사한 결과, 매번 콘텐츠 계층이 아닌 액세스 계층에서 장애가 발생했습니다.

지속적인 모니터링을 위해 Perplexity SEO 트래커로도 사용되는 ICODA의 AI 가시성 검사기를 실행하여 어떤 AI 크롤러가 사이트에 도달하는지, 구조가 좋은 점수를 받는 곳은 어디인지, 인용 발자국이 이미 존재하는 곳은 어디인지 정확히 파악하세요. 이 검사는 무료이며 1분도 채 걸리지 않으며, 분석가들이 기업 감사에 사용하는 것과 동일한 진단 결과를 제공합니다.

2026년 Perplexity에 등장하는 브랜드는 자체 규칙이 있는 별도의 채널로 취급하는 브랜드입니다. 그렇지 않은 브랜드는 여전히 아무도 읽지 않는 검색 결과 페이지에 최적화되어 있습니다.

자주 묻는 질문(FAQ)

Perplexity SEO는 이름만 바뀐 일반 SEO인가요?

Perplexity SEO는 Google SEO와 구조적으로 다릅니다. Google은 10페이지에 걸쳐 순위를 매기는 반면, Perplexity는 하나의 종합 답변에 4~6개의 출처를 인용합니다. 순위를 놓고 경쟁하는 것이 아니라 매우 짧은 후보 목록을 만들기 위해 경쟁하는 것입니다. 도메인 권한은 여전히 중요하지만 콘텐츠 형식과 신선도에 훨씬 더 많은 가중치가 부여됩니다.

내 사이트가 Google에서는 순위에 있지만 Perplexity에는 표시되지 않습니다.

가장 일반적인 원인은 사용자가 알지 못하는 기술적 차단입니다. Perplexity는 두 개의 크롤러(PerplexityBot 및 Perplexity-User)를 실행하며, 많은 Cloudflare 또는 WAF 구성이 둘 중 하나 또는 둘 모두를 자동으로 차단합니다. 해당 에이전트에 대한 robots.txt 및 액세스 로그를 구체적으로 확인하세요. 봇이 페이지에 도달할 수 없다면 높은 Google 순위는 아무 의미가 없습니다.

Perplexity는 Google과 어떻게 소스를 다르게 선택하나요?

Perplexity는 Google보다 훨씬 더 적극적으로 새로움에 가중치를 둡니다. 전체 인용의 약 절반이 올해에 게시된 콘텐츠에서 발생합니다. 순위가 높은 2019년 상록수 게시물은 완전히 건너뛰게 될 가능성이 높습니다. Reddit, G2, LinkedIn과 같은 타사 커뮤니티 콘텐츠도 기존 SEO가 고려하지 않는 비율로 인용됩니다.

Perplexity는 왜 공식 브랜드 페이지 대신 Reddit을 계속 인용하나요?

커뮤니티 콘텐츠는 대규모 쿼리 연구에서 Perplexity 인용의 약 20%를 차지합니다. Perplexity는 동료 검증을 보조적인 신뢰 신호가 아닌 주요 신뢰 신호로 취급합니다. 브랜드가 포럼과 리뷰 플랫폼에서 진정성 있게 논의되고 있지 않다면, 이는 있으면 좋은 것이 아니라 실제 인용 채널을 놓치고 있는 것입니다.

최적화 후 Perplexity에 표시되기까지 얼마나 걸리나요?

기술적인 액세스가 확인되면 기존 도메인의 경우 2~4주가 현실적입니다. 병목 현상의 원인은 콘텐츠 품질이 아니라 크롤러가 차단되었거나 페이지 구조에 너무 깊숙이 묻혀 있는 답변인 경우가 대부분입니다. 액세스 및 구조를 먼저 수정하고 콘텐츠 개선은 거기서부터 시작하세요.

스키마 마크업이 실제로 Perplexity 인용에 영향을 주나요?

대규모 연구에 따르면 문서, FAQ 또는 HowTo 스키마가 있는 페이지는 인용될 확률이 약 28% 더 높습니다. 스키마는 Perplexity의 재랭커에게 구조적 명확성을 알리는 신호이지 장식용이 아닙니다. 스키마는 이미 최적화된 콘텐츠에서 적은 노력으로 가장 높은 수준의 개선 효과를 얻을 수 있는 방법 중 하나입니다.