/캐노니컬 태그 (Canonical Tag)
📘개념⭐️ Pillar

캐노니컬 태그 (Canonical Tag)

최종 업데이트:

정의

캐노니컬 태그(canonical tag)는 <link rel="canonical" href="URL"/> 형태로 HTML <head>에 삽입하는 메타 태그다. 동일하거나 매우 유사한 콘텐츠가 여러 URL에 걸쳐 존재할 때, 검색엔진에 "이 URL을 대표 버전으로 처리해달라"고 지시한다.

중복 콘텐츠가 방치되면 검색엔진이 여러 URL 중 어느 것을 인덱싱할지 혼란을 겪고, 각 URL로 분산된 PageRank가 통합되지 않아 순위에 불리하다. 캐노니컬 태그는 이 분산을 방지하고 SEO 신호를 하나의 URL에 집중시키는 핵심 온페이지 도구다.


요약

캐노니컬 핵심: ①<link rel="canonical" href="정규URL"/><head> 삽입 → ②www/non-www, HTTP/HTTPS, URL 파라미터, 모바일 버전 등 중복 URL을 하나로 통합 → ③PageRank가 정규 URL에 집중되어 순위 유리 → ④모든 페이지에 자기 참조 캐노니컬(self-referencing) 삽입 권장. 구글은 캐노니컬을 힌트로 처리하므로 신뢰 시그널 일관성이 중요하다.


캐노니컬 태그가 필요한 5가지 상황

1. URL 파라미터 중복

/products?sort=price, /products?sort=name, /products?color=blue 같은 파라미터 조합이 동일한 콘텐츠를 표시할 때. 모든 파라미터 변형 URL에 /products 캐노니컬을 지정한다. 자세히는 URL 파라미터 참조.

2. www vs non-www, HTTP vs HTTPS

http://example.com, https://example.com, http://www.example.com, https://www.example.com이 동일 콘텐츠를 반환하는 경우. HTTPS 버전을 정규 URL로 지정하고 301 리다이렉트와 병행한다.

3. 페이지네이션

/blog, /blog?page=2, /blog?page=3페이지네이션 URL. 각 페이지는 독립 콘텐츠이므로 자기 참조 캐노니컬을 사용하고, /blog 페이지가 첫 페이지를 대표하도록 처리한다. 자세히는 페이지네이션 참조.

4. 모바일/데스크탑 별도 URL

m.example.comexample.com이 분리 운영되는 레거시 구조. 모바일 URL에 데스크탑 URL을 캐노니컬로 지정하고, 데스크탑 URL에는 <link rel="alternate" media="only screen and (max-width: 640px)" href="모바일URL"/>을 추가한다. 자세히는 모바일 퍼스트 인덱싱 참조.

5. 콘텐츠 신디케이션

타 사이트에 기고하거나 콘텐츠를 제공하는 경우. 외부에 게시된 복사본에 원본 자사 URL을 캐노니컬로 지정해달라고 요청하면 원본의 SEO 신호를 보호할 수 있다.


캐노니컬 태그 구현 방법

HTML 구현

<head>
  <link rel="canonical" href="https://example.com/products/" />
</head>

모든 페이지의 <head> 안에 삽입한다. 절대 URL(https://포함)을 사용한다. 상대 URL은 구현 오류 발생 가능성이 있어 권장하지 않는다.

HTTP 헤더 구현

HTML이 없는 PDF 등 비-HTML 리소스에는 HTTP 응답 헤더에 캐노니컬을 설정할 수 있다:

Link: <https://example.com/document.pdf>; rel="canonical"

자기 참조 캐노니컬 (Self-referencing Canonical)

정규 URL 자체에도 자기 자신을 가리키는 캐노니컬을 삽입한다. 구글이 예상치 못한 URL 변형(파라미터 자동 추가 등)에서도 정규 URL을 인식하도록 보호한다.

<!-- https://example.com/products/ 페이지에서 -->
<link rel="canonical" href="https://example.com/products/" />

캐노니컬 vs 다른 중복 처리 도구

[COMPARISON_TABLE: canonical vs 301 리다이렉트 vs noindex vs robots.txt 비교]

canonical tag

  • 효과: 정규 URL 지정, PageRank 집중
  • 원본 URL 유지: ✅ (접근 가능)
  • 구글 처리: 힌트(hint) — 무시 가능
  • 적합 상황: 중복 콘텐츠 통합, URL 파라미터

301 리다이렉트

  • 효과: 영구 이전, PageRank 전달
  • 원본 URL 유지: ❌ (자동 이동)
  • 구글 처리: 명령(directive) — 항상 따름
  • 적합 상황: URL 영구 변경, 도메인 이전

noindex

  • 효과: 인덱싱 제외
  • 원본 URL 유지: ✅ (크롤링은 허용)
  • 구글 처리: 명령 — 거의 항상 따름
  • 적합 상황: 인덱싱 불필요 페이지 제외

자세히는 301 리다이렉트, noindex 참조.


흔한 캐노니컬 실수 5가지

실수 1: 상대 URL 사용

<link rel="canonical" href="/products/"/> 대신 <link rel="canonical" href="https://example.com/products/"/> 절대 URL을 사용한다.

실수 2: 캐노니컬 체인

A → B → C로 캐노니컬이 연결되는 체인 구조. 구글이 중간 단계를 따라가지 않을 수 있다. A와 B 모두 직접 C를 가리켜야 한다.

실수 3: 잘못된 캐노니컬 설정

CMS 기본 설정으로 모든 페이지의 캐노니컬이 홈페이지(/)를 가리키는 경우. 각 페이지가 자신의 URL을 가리키도록 수정한다.

실수 4: 캐노니컬과 noindex 동시 적용

같은 페이지에 캐노니컬과 noindex를 함께 사용하면 충돌이 발생한다. 인덱싱하고 싶지 않은 페이지에는 noindex만, 정규 URL을 지정하고 싶은 페이지에는 canonical만 사용한다.

실수 5: 페이지네이션 전체를 첫 페이지 캐노니컬로 처리

/blog?page=2의 캐노니컬을 /blog로 설정하면 구글이 2페이지 고유 콘텐츠를 무시한다. 페이지네이션 각 페이지는 자기 참조 캐노니컬을 사용하는 것이 권장된다.


한국 시장 적용

한국어/영어 다국어 사이트

글로벌 서비스의 한국어 버전을 운영하는 경우, hreflang과 캐노니컬을 함께 사용해야 한다. 한국어 페이지는 한국어 URL을 캐노니컬로 지정하고, 영어 페이지는 영어 URL을 캐노니컬로 지정한다. 언어별 정규 URL을 hreflang 태그로 상호 참조한다. 자세히는 hreflang 참조.

네이버 SEO와 캐노니컬

네이버 검색은 rel="canonical"을 구글만큼 강력하게 지원하지 않는다. 네이버에서 중복 콘텐츠 문제를 완전히 해결하려면 301 리다이렉트로 정규 URL 하나만 유지하는 것이 더 확실하다. 자세히는 네이버 SEO 참조.

CMS별 구현

한국에서 많이 사용하는 WordPress는 Yoast SEO 또는 RankMath 플러그인이 캐노니컬 자동 삽입을 지원한다. Next.js는 generateMetadata() 함수에서 alternates.canonical로 설정한다.


자주 묻는 질문

Q. 캐노니컬 태그를 설정해도 구글이 무시하는 경우가 있나요?
A. 그렇다. 구글은 캐노니컬을 "힌트"로 처리하며, 자체 판단으로 다른 URL을 정규 URL로 선택할 수 있다. 특히 내부 링크, 사이트맵, 301 리다이렉트 등 다른 신호가 캐노니컬과 충돌할 때 구글이 캐노니컬을 무시하는 경향이 있다. 모든 신호가 정규 URL을 일관되게 가리키도록 유지하는 것이 중요하다.

Q. 외부 도메인 URL을 캐노니컬로 지정할 수 있나요?
A. 가능하다. 콘텐츠 신디케이션 상황에서 외부 사이트에 게시된 복사본이 원본 자사 URL을 캐노니컬로 가리키는 것은 구글이 인정하는 패턴이다. 단, 남용 목적의 크로스 도메인 캐노니컬은 구글이 신뢰하지 않을 수 있다.

Q. 캐노니컬과 301 리다이렉트 중 무엇을 우선 사용해야 하나요?
A. URL을 영구적으로 변경하거나 없애려면 301 리다이렉트가 정확하다. 구 URL을 유지하면서 중복 콘텐츠를 정규화하려면 캐노니컬을 사용한다. 예를 들어 URL 파라미터 변형은 사용자 경험상 그대로 두되 캐노니컬로 정규화하고, 도메인 이전·URL 구조 변경은 301 리다이렉트를 사용한다.

Q. 캐노니컬 설정 후 효과를 어떻게 확인하나요?
A. Google Search Console의 "URL 검사 도구"에서 특정 URL을 입력하면 구글이 인식한 정규 URL을 확인할 수 있다. "구글 선택 정규 URL"이 내가 지정한 캐노니컬과 일치하면 올바르게 작동 중이다. 불일치 시 다른 신호(내부 링크, 사이트맵)와의 충돌을 점검한다.

Q. 사이트에 캐노니컬이 없으면 어떻게 되나요?
A. 구글이 자체 판단으로 정규 URL을 선택한다. 예상과 다른 URL이 선택될 수 있어 PageRank가 분산되고 크롤 예산이 낭비될 수 있다. 특히 URL 파라미터가 많거나 CMS가 여러 URL을 생성하는 사이트는 명시적 캐노니컬이 없으면 인덱싱 품질이 저하될 수 있다.


관련 출처

  • Google Search Central (2024). Consolidate duplicate URLs with canonical tags. Google Developers.
  • Moz (2024). Canonicalization: What It Is and How to Use It. Moz Blog.
  • John Mueller, Google (2023). Canonical tag best practices. Google Search Central Blog.

이 페이지를 참조하는 항목

관련 항목

📘개념
크롤 버짓 (Crawl Budget)
크롤 버짓(Crawl Budget)은 구글봇이 특정 기간에 한 사이트를 크롤하는 총 횟수로, 대규모 사이트에서 중요한 페이지가 색인되지 않는 주요 원인이다.
📙How-to
인덱싱 커버리지 진단
인덱싱 커버리지 진단은 GSC 색인 보고서로 사이트의 전체 색인 상태를 점검하고, 색인되지 않은 페이지의 원인을 파악해 수정하는 SEO 핵심 작업이다.
📘개념Pillar
AEO란?
AEO는 AI 답변 엔진이 콘텐츠를 인용하도록 최적화하는 기법이다.
📘개념Pillar
중복 콘텐츠 (Duplicate Content)
중복 콘텐츠(Duplicate Content)는 여러 URL에 같거나 매우 유사한 콘텐츠가 존재하는 상태로, 검색엔진의 권위 분산과 색인 혼란을 일으키는 흔한 기술 SEO 문제다.
📘개념
Noindex (노인덱스)
noindex는 robots meta 태그나 HTTP 헤더로 검색엔진 봇에 '이 페이지를 검색 결과에 포함하지 말라'고 지시하는 온페이지 크롤링 제어 지시자로, 검색 노출이 불필요하거나 해가 되는 페이지를 인덱스에서 제외해 크롤 예산을 절약하고 사이트 품질 시그널을 개선한다.
📘개념
페이지네이션 (Pagination)
페이지네이션(Pagination)은 긴 콘텐츠·상품 목록을 여러 페이지로 분할하는 기법으로, rel=prev/next가 2019년 폐기된 이후 카노니컬·무한 스크롤·자세히 보기 방식으로 대체 관리된다.
📘개념
301 리다이렉트
301 리다이렉트는 URL이 영구적으로 이동했음을 브라우저와 검색엔진에 알리는 HTTP 상태 코드로, 구 URL의 PageRank·백링크 권위를 신 URL로 전달해 SEO 손실 없이 URL 구조를 변경하는 기술 SEO 핵심 도구다.
📘개념
크롤링 vs 인덱싱
크롤링(Crawling)은 검색엔진 봇이 링크를 따라 웹을 순회하며 페이지를 수집하는 과정이고, 인덱싱(Indexing)은 수집된 페이지를 분석해 검색 데이터베이스에 저장하는 과정으로, SEO 3단계(크롤링→인덱싱→랭킹)의 첫 두 단계다.
📘개념Pillar
hreflang 태그
hreflang은 같은 콘텐츠의 다국어·다지역 버전을 구글에 명시하는 HTML 속성으로, 올바른 언어·지역 페이지를 적절한 사용자에게 노출하고 중복 콘텐츠 신호를 방지한다.
📘개념Pillar
모바일 퍼스트 인덱싱 (Mobile-First Indexing)
모바일 퍼스트 인덱싱(Mobile-First Indexing)은 구글이 사이트의 모바일 버전을 기준으로 크롤·색인·랭킹하는 시스템으로, 2024년 전체 사이트 완전 적용으로 현재 SEO의 기본 전제다.
📙How-to
robots.txt에 AI 봇 허용하는 방법
AI 봇 허용은 GPTBot·ClaudeBot·PerplexityBot 등 주요 AI 크롤러의 사이트 접근을 robots.txt에서 명시해 생성형 AI 답변 인용에 자사 콘텐츠를 노출시키는 기술 설정이다.
📘개념Pillar
사이트 아키텍처 (Site Architecture)
사이트 아키텍처(Site Architecture)는 웹사이트의 페이지 계층·URL 구조·내부 링크 설계의 총체로, 크롤 효율·색인 품질·사용자 탐색 경험을 동시에 결정하는 SEO 기반 요소다.
📘개념
URL 파라미터 (URL Parameters)
URL 파라미터(URL Parameters)는 URL 끝에 ?key=value 형태로 추가되는 쿼리 문자열로, 동일 콘텐츠를 여러 URL 변형으로 노출해 중복 콘텐츠 문제와 크롤 예산 낭비를 일으키는 기술 SEO 주요 관리 대상이다.

이런 항목도 있어요

이 페이지가 도움이 됐나요?

게시:

업데이트: