씬 콘텐츠 (Thin Content)
최종 업데이트:
정의
씬 콘텐츠(Thin Content)는 사용자의 질문에 충분히 답하지 못하거나 독립적인 가치를 제공하지 못하는 페이지다. 분량이 짧은 것이 직접적 원인이 아니라, 사용자에게 실질적 가치가 없다는 것이 본질이다.
Google Search Central 공식 문서에서는 씬 콘텐츠를 "사이트의 전반적인 품질에 부정적인 영향을 미치는 낮은 품질의 페이지"로 정의하며, Helpful Content 시스템이 이를 자동으로 감지해 사이트 전체 품질 점수에 반영한다.
요약
씬 콘텐츠 처리 순서: ①GSC에서 색인 거절 페이지 확인 → ②가치 평가 → ③보강/통합/삭제 결정 → ④처리 → ⑤3개월 후 효과 측정. 한 번에 너무 많이 처리하지 않는다 — 전체의 10% 이하씩 점진적으로.
Google이 정의한 씬 콘텐츠 4가지 유형
Google Search Central은 다음 유형을 씬 콘텐츠로 명시한다.
1. 자동 생성 콘텐츠 (Auto-Generated Content)
AI 또는 기계로 대량 생성했으며 사람의 검토 없이 발행한 콘텐츠다. 단, Google은 "AI로 작성했다는 사실 자체가 문제가 아니라, 사용자에게 가치 있는지가 기준"이라고 명시한다(Google Search Central, 2023). 잘 만들어진 AI 보조 콘텐츠는 페널티 대상이 아니다.
2. 얇은 어필리에이트 페이지 (Thin Affiliate Pages)
제조사나 공급사의 제품 설명을 그대로 복사하고 어필리에이트 링크만 추가한 페이지. 고유한 리뷰, 비교, 경험이 없으면 씬 콘텐츠로 분류된다.
3. 스크래핑된 콘텐츠 (Scraped Content)
다른 사이트의 콘텐츠를 가져와 약간 변형하거나 그대로 게재한 경우. 자세히는 중복 콘텐츠 항목 참조.
4. 도어웨이 페이지 (Doorway Pages)
특정 키워드 노출만을 위해 만든 페이지로, 실질적 가치 없이 다른 페이지로 유도하는 역할. 자세히는 도어웨이 페이지 항목 참조.
씬 콘텐츠의 7가지 특징
1. 사용자 질문에 답하지 못함
핵심 질문에 대한 명확한 답변이 없고, 다른 출처가 더 나은 정보를 제공한다.
2. 1차 정보 부재
자체 경험, 연구, 데이터가 없이 다른 출처를 단순 재가공했다. 자세히는 E-E-A-T 항목 참조.
3. 명확한 대상 독자 없음
누구를 위한 페이지인지 불분명하고 일반론만 담겨 있다.
4. 검색엔진을 위한 키워드 배치
사용자 경험보다 키워드 포함이 우선이다. 같은 키워드가 불자연스럽게 반복된다.
5. 자동/템플릿 기반 생성
변수(지역명, 카테고리명 등)만 바뀌고 나머지 구조가 동일한 페이지 양산.
6. 짧은 분량 + 빈 공간
콘텐츠 대신 광고, 이미지, 여백이 대부분을 차지한다.
7. 오래된 또는 잘못된 정보
업데이트되지 않아 현재 상황에 맞지 않는 내용. 자세히는 콘텐츠 최신성 항목 참조.
씬 콘텐츠가 SEO에 미치는 영향
페이지 단위 영향
해당 페이지는 색인 거절("크롤됨 — 색인 안 됨") 상태로 분류되어 검색 결과에 노출되지 않는다. 자세히는 인덱싱 커버리지 진단 항목 참조.
사이트 전체 영향 (Sitewide Signal)
Helpful Content 시스템의 핵심 특성은 페이지가 아닌 사이트 전체를 평가한다는 것이다. 일부 씬 콘텐츠가 사이트 전체 품질 점수를 낮춰, 좋은 다른 페이지의 순위까지 함께 하락할 수 있다. 자세히는 Helpful Content 시스템 항목 참조.
크롤 버짓 낭비
가치 없는 페이지를 크롤하는 데 크롤 버짓이 소모되어, 핵심 페이지의 색인 기회가 줄어든다. 자세히는 크롤 버짓 항목 참조.
수동 조치 위험
반복적인 씬 콘텐츠 패턴(특히 자동 생성, 스크래핑)은 SpamBrain 감지 또는 수동 검토자에 의해 수동 조치로 이어질 수 있다. 자세히는 구글 수동 조치 항목 참조.
씬 콘텐츠 진단 5단계
1단계: GSC 색인 보고서 확인
GSC → 색인 → 페이지에서 "크롤됨 — 색인 안 됨" 페이지 수를 확인한다. 이 상태의 페이지가 많다면 씬 콘텐츠 문제일 가능성이 높다.
2단계: 분량별 페이지 분류
Screaming Frog 또는 Ahrefs Site Audit으로 전체 페이지를 크롤한 뒤 단어 수 기준으로 분류한다. 한국어 기준 500자 미만 페이지 리스트를 우선 점검한다(영어 300단어 기준).
3단계: 트래픽 제로 페이지 발견
GSC에서 지난 6개월간 노출수 0인 페이지 목록을 추출한다. 트래픽 0 + 색인 안 됨 조합이 씬 콘텐츠의 명확한 신호다.
4단계: 콘텐츠 가치 평가
각 페이지에 대해 다음 질문에 답한다.
- 이 페이지가 없어도 사용자에게 불편이 없는가?
- 같은 주제로 훨씬 나은 외부 페이지가 존재하는가?
- 이 페이지가 우리 사이트 권위를 높이는가, 낮추는가?
5단계: 우선순위 결정
가치 없음 + 트래픽 0 + 백링크 없음 조합이 최우선 처리 대상이다. 백링크가 있는 페이지는 삭제 시 반드시 301 리다이렉트를 적용한다.
씬 콘텐츠 해결 4가지 방법
[COMPARISON_TABLE: 씬 콘텐츠 처리 방법 — 상황별 선택 기준]
방법 1: 콘텐츠 보강 (Improve)
가치 있는 주제인데 깊이가 부족한 경우. 1차 경험, 실제 데이터, 전문적 인사이트를 추가해 사용자에게 실질적 가치를 제공하는 페이지로 발전시킨다. 자세히는 E-E-A-T, BLUF 작성법 항목 참조.
방법 2: 콘텐츠 통합 (Consolidate)
비슷한 얇은 페이지가 여러 개인 경우. 가치 있는 내용을 하나의 깊이 있는 페이지로 통합하고, 기존 페이지에서 301 리다이렉트를 적용한다.
방법 3: noindex 처리 (Hide)
비즈니스상 페이지가 필요하지만 검색 결과 노출은 불필요한 경우(내부 도구 페이지, 법적 보고 페이지 등). <meta name="robots" content="noindex"> 적용.
방법 4: 완전 삭제 (Delete)
가치도 없고 트래픽도 없고 백링크도 없는 페이지. 410 응답(영구 삭제)으로 처리하거나 가장 관련성 높은 페이지로 301 리다이렉트. 자세히는 콘텐츠 프루닝 항목 참조.
AEO 시대의 씬 콘텐츠
LLM의 가치 평가 방식
BERT·MUM 기반 LLM은 키워드 매칭이 아닌 의미적 깊이로 콘텐츠 가치를 판단한다. 씬 콘텐츠는 의미 밀도가 낮아 AI가 인용할 만한 명확한 답변을 추출하지 못한다. 자세히는 구글 BERT 알고리즘, 구글 MUM 알고리즘 항목 참조.
답변 블록 추출 불가
AI 답변 엔진은 페이지에서 50–300자 단위의 명확한 답변을 추출한다. 씬 콘텐츠는 추출할 만한 밀도 있는 답변 블록이 없어 인용 기회가 없다. 자세히는 답변 블록 만들기 항목 참조.
한국 시장 적용
흔한 씬 콘텐츠 패턴
- 네이버 블로그 복사: 자체 블로그 글을 자사 사이트에 그대로 복사 (이중 게재)
- CMS 자동 생성 페이지: 카페24, 아임웹에서 자동 생성된 빈 카테고리·태그 페이지
- 한국어 AI 자동 생성: 검토 없이 발행된 AI 대량 생성 콘텐츠
한국어 분량 기준
한국어는 영어보다 정보 밀도가 높아 동일 의미를 더 적은 글자로 표현한다. 영어 300단어 기준 약 한국어 500–700자 정도이나, 분량보다 가치 있는 정보량이 더 중요한 지표다.
네이버 검색의 씬 콘텐츠
네이버도 C-Rank 알고리즘으로 콘텐츠 품질을 평가한다. 단, 네이버는 구글 Helpful Content 시스템처럼 사이트 전체 평가보다 채널(블로그, 카페) 신뢰도 중심이다. 자세히는 네이버 SEO 작동 원리 항목 참조.
자주 묻는 질문
Q. 짧은 글이면 무조건 씬 콘텐츠인가요?
A. 아니다. Google은 분량보다 가치를 평가한다. 50자짜리 FAQ 답변도 사용자 질문에 완전히 답한다면 씬 콘텐츠가 아니다. 반대로, 2,000자짜리 글도 일반론만 반복하면 씬 콘텐츠다. 기준은 "이 페이지가 없으면 사용자가 불편한가?"다.
Q. AI로 글을 쓰면 씬 콘텐츠로 분류되나요?
A. Google은 2023년 공식 성명에서 "AI 작성 여부가 아닌 품질이 기준"이라고 명확히 밝혔다. AI 도구로 작성했더라도 사람이 검토하고 1차 경험·전문 인사이트를 추가했다면 문제없다. 검토 없이 대량 발행한 저품질 AI 콘텐츠가 씬 콘텐츠로 분류된다.
Q. 씬 콘텐츠를 모두 삭제해야 하나요, 보강해야 하나요?
A. 케이스별로 다르다. 백링크가 있으면 삭제보다 보강 또는 통합이 유리하다. 비즈니스 핵심 주제라면 보강한다. 트래픽·백링크·비즈니스 가치 모두 없으면 삭제가 가장 효율적이다. 한 번에 사이트 전체의 10% 이상을 처리하지 않는 것이 안전하다.
Q. 씬 콘텐츠 하나가 사이트 전체에 영향을 주나요?
A. Helpful Content 시스템은 사이트 전체를 평가한다. Google의 공식 문서에 따르면 "사이트에 많은 씬 콘텐츠가 있으면 모든 페이지의 품질 평가에 영향을 줄 수 있다"고 명시되어 있다. 단, 씬 콘텐츠가 1–2개인 경우 사이트 전체 영향은 미미하다.
Q. 씬 콘텐츠를 처리하면 회복까지 얼마나 걸리나요?
A. 개선 효과는 보통 3–6개월 후에 나타난다. Google이 사이트 전체를 재평가하는 주기가 있기 때문이다. 코어 업데이트 직후 처리하면 다음 코어 업데이트에서 회복이 나타나는 패턴이 많다. 단기 회복을 기대하기보다 꾸준히 품질을 높이는 것이 중요하다.
관련 출처
- Google Search Central (2023). Creating helpful, reliable, people-first content. https://developers.google.com/search/docs/fundamentals/creating-helpful-content
- Google Search Central (2023). Google's core updates and your website. https://developers.google.com/search/docs/fundamentals/google-core-updates
- Google Search Central (2022). What site owners should know about Google's core updates. https://developers.google.com/search/blog/2019/08/core-updates
이 페이지를 참조하는 항목
- 📘개념Helpful Content System: 구글의 사람 중심 콘텐츠 평가 시스템
- 📙How-to구글 수동 조치(Manual Action): 패널티 원인과 해제 방법
- 📘개념구글 서치 콘솔 (Google Search Console) 완전 활용 가이드
- 📙How-to인덱싱 커버리지 진단
- 📘개념GEO 마스터 가이드: 5대 영역 체크리스트
- 📘개념AEO란?
- 📘개념GEO란?
- 📙How-to답변 블록 만들기
- 📘개념블랙햇 SEO
- 📘개념클로킹 (Cloaking)
- 📘개념콘텐츠 최신성 (Content Freshness)
- 📘개념콘텐츠 갭 (Content Gap)
- 📙How-to콘텐츠 프루닝 (가지치기)
- 📘개념도어웨이 페이지 (Doorway Pages)
- 📘개념중복 콘텐츠 (Duplicate Content)
- 📘개념E-E-A-T
- 📙How-toBLUF 작성법
- 📘개념YMYL (Your Money Your Life)
- 📘개념네이버 SEO 작동 원리
- 📘개념JavaScript SEO