백링크 분석하기: 펭귄 알고리즘 이후의 대처법
몇 년 전만 해도 SEO에서 자신의 웹사이트와 연결된 백링크(Backlink)의 품질을 신경 쓸 필요가 없었습니다. 그것은 숫자 게임이었죠. 품질보다 양이 더 중요시 여겨졌던 시절이 분명히 있었습니다. 최대한 많은 웹사이트를 통해 백링크를 확보하고, 해당 링크가 구글 검색 결과에서 정확한 문구에 하이퍼 링크가 걸려 있는지 확인하고, 클릭 가능한 머니 앵커 텍스트(money anchor text)가 포함되어 있는지 확인하는 게 일이었죠. 그래서 링크는 진입 장벽이 낮고 링크를 쉽게 얻을 수 있는 디렉토리, 포럼, 북마크 페이지, 그리고 블로그 등의 ‘저품질 웹사이트’에 위치했습니다.
그러나 2012년 4월 24일 펭귄 알고리즘이 업데이트되면서 이러한 SEO 규칙이 완전히 바뀌어 버렸지요. 새로운 펭귄 알고리즘은 기존 구글 가이드를 준수하지 않았습니다. 스팸 가능성이 있고 부자연스러운 링크가 걸려 있는 웹사이트를 대상으로 개발되었죠. 처음에는 몇 달에 한 번씩 업데이트가 이루어졌습니다.
그리고 2016년 9월 23일, 핵심 알고리즘의 일부로서 실시간으로 작동되기 시작했습니다. 즉 웹사이트의 순위가 실시간으로 평가되고, 영향을 받는다는 의미입니다.
오늘날의 SEO는 검색 엔진 중심이 아닌 유저 중심으로 변해가고 있습니다. 그래서 높은 퀄리티의 웹사이트로부터 최대한 자연스러운 링크를 받고, 부자연스러운 링크 빌딩에서 벗어나는 것이 중요해졌죠. 하지만 여전히 가끔씩 스팸성 링크는 스며들고 있습니다. 그러니 오늘은 스팸성 링크 사례와 이러한 링크에 대해 어떻게 대처해야 하는지 소개하고자 합니다.
백링크는 무엇인가?
백링크(Backlink)는 한 웹사이트를 다른 웹사이트로 연결하는 링크입니다. 이러한 링크들은 구글 검색 엔진에 여러분의 웹사이트에 대한 정보를 주고, 이 정보는 구글 검색 순위에 영향을 줄 수 있기 때문에 상당히 중요합니다.
백링크는 정상적인 URL 주소 그대로 표기하거나(예를 들어 https://yourwebsite.com 같은), 혹은 브랜드나 관련 문구에 하이퍼 링크로 걸어 클릭 가능한 텍스트(예를 들어 ‘이 웹사이트 바로가기’)로 표기할 수도 있습니다. HTML에서 앵커 텍스트가 있는 URL은 다음과 같습니다.
백링크를 사용하는 가장 주된 목적은 독자들에게 웹사이트를 알리거나 링크 주스(link juice, 웹 페이지 내 백링크 분포와 이러한 링크의 강도 및 평판을 설명하는 구어체 SEO 용어)를 전달하고 구글 검색 순위를 올리는 것입니다. 우선 두-팔로우 백링크(do-follow backlinks)를 먼저 확인하는데 집중하길 권합니다.
※ 링크에는 노-팔로우 링크와 두 팔로우 링크가 있는데, 노-팔로우 링크는 검색 엔진이 웹 서와 링크된 문서를 복사하는 것을 차단하는 것을 의미 한다. 두-팔로우 링크는 검색 엔진에 의한 링크 추적을 막지 않는다는 의미 한다.
그 이유는 두-팔로우 링크가 구글 주스를 통과하기 때문이며, 그래서 구글 검색 알고리즘의 시야에서는 보다 더 중요하기 때문입니다. 노-팔로우 링크가 링크 주스를 통과하지 못했다 하더라도, 여전히 링크 프로필을 약화시킬 수 있을 것입니다. 특히 다수의 저품질 웹사이트에서 온 부자연스러운 링크일 경우 더욱 그렇습니다. 그러니 여러분의 프로필이 안전한지 확인하기 위해 두-팔로우 링크를 먼저 확인하고 나서, 노 팔로우 링크를 확인해 봅시다.
악의적이고 스팸성 높은 사이트가 여러분의 웹사이트와 연결되어 있다는 생각이 드나요? 링크 프로필을 명확히 확인하고 싶나요? 그렇다면 다음 단계는 모든 리소스에서 여러분의 링크를 수집하는 것입니다.
백링크 수집하기
백링크에서 가장 중요한 소스는 바로 자신의 구글 서치 콘솔(Google Search Console) 계정입니다. 이는 가장 신뢰할 수 있는 데이터 소스이기 때문이지요. 이 백링크는 구글 봇에 의해 직접적으로 크롤링되는 GSC에서 발견될 수 있습니다. 이 백링크들을 다운로드 받으려면 구글 서치 콘솔 계정에서 검색 트래픽→사이트로 연결되는 링크로 이동하면 됩니다.
그런 다음, 최다 링크 사용자 항목 밑에 있는 ‘더보기’를 클릭합니다.
아래와 같이 새로운 페이지가 로드되면, ‘더 많은 샘플 링크 다운로드’와 ‘최신 링크 다운로드’를 클릭하십시오.
충분한 수의 백링크를 수집하였다면, 철저한 백링크 확인을 수행할 준비가 된 것입니다. 이 경우엔 둘 이상의 백링크 소스를 사용하는 것이 좋습니다. 백링크를 다운로드할 수 있는 도구에는 아래와 같은 도구들이 있습니다.
- Semrush
- Ahrefs
- Searchmetrics
- SEO SpyGlass
- Majestic
가장 좋은 방법(하나의 링크 소스이든 여러 개의 링크 소스이든 상관없이)은 링크를 단일 스프레드 시트 혹은 여러 개의 스프레드 시트로 내보내고 중복되는 링크를 제거하는 것입니다. 만약 처음으로 백링크를 확인하려는 경우라면, 충분한 수의 데이터 포인트를 수집하십시오. 그러면 가장 포괄적인 링크 프로필을 제공해 줍니다.
모든 백링크를 하나의 엑셀 파일로 모으고 중복 값을 제거한 후에는 엑셀 스프레드 시트에서 품질을 평가할 수 있습니다. 주요 웹 크롤러(Ahrefs, Majestic, Semrush 크롤러 등)들이 robots.txt 파일에서 주요 스팸성 웹사이트들의 크롤링을 차단시키고 있다는 점은 매우 중요합니다. 이러한 이유로 구글 서치 콘솔을 통해 백링크 데이터를 얻는 것이 무척 중요합니다.
어떤 종류의 백링크가 문제를 일으킬 수 있나요?
펭귄은 이미 몇 년 전에 공개된 것입니다. SEO에서 백링크를 얻는 방식도 바꾸었습니다. 하지만 구글은 여전히 링크 프로필을 분석할 때 구글 검색 랭킹을 떨어뜨릴 수 있는 스팸성 링크 패턴을 발견해 내려고 합니다.
다음은 랜덤 한 다수의 링크 프로필에서 발견한 일반적인 스팸성 사이트의 몇 가지 예입니다.
1. 백링크를 추가하기 위해 만들어진 프로필
스팸성 포럼 프로필은 특정 웹사이트를 가리키는 백링크를 얻기 위해 만들어졌습니다. 백링크가 프로필에 추가될 수 있고, URL이나 키워드 문구 같은 시그니처에 위치할 수도 있습니다. 혹은 여러분의 웹사이트의 www 섹션 아래 배치될 수도 있습니다. 백링크를 배치하기 위해 만들어진 프로필을 보면 가치 있는 포스트가 없거나(스팸성이거나 전혀 관련 없는 게시글), 아예 게시물이 없고, 마지막 활동이 처음 만들어진 날짜와 동일합니다.
2. 포럼 게시글
스팸성 있는 포럼 게시글은 보통 스팸성, 광고성이 매우 짙은 콘텐츠 백링크와 함께 추가됩니다. 일반적으로 이러한 종류의 백링크는 ‘플로리다에서 가장 저렴한 호텔’, ‘시카고 미용실’과 같은 앵커 텍스트를 사용하며 백링크에 연결된 웹사이트를 매우 적극적으로 홍보합니다. 만약 해당 포럼이 적당히 관리되는 포럼이 아니라면, 단순히 백링크를 많이 얻기 위한 많은 게시글을 올릴 수 있을 것입니다.
3. 블로그 / 웹사이트에 달린 스팸성 댓글
이러한 스팸성 댓글들은 기사 아래 댓글창으로 남겨져 블로그에 추가되는데요, 어떠한 가치나 내용도 없으며 백링크를 얻기 위해서만 쓰이는 것들이 대부분입니다. 또한 이름만 있는 섹션에서는 키워드로 가득 찬 백링크를 보게 됩니다(하단 화면 참조)
댓글은 아래와 같이 크게 3가지 카테고리로 나누어집니다.
- 사람이나 봇이 남긴 댓글
- 트랙백: 기사나 블로그 게시글에 대한 응답, 콘텐츠의 출처 부분을 포함하여 자신의 블로그에 직접 작성
- 핑백: 자동으로 전송되었으며, 어떠한 콘텐츠도 포함되지 않음
4. 낮은 품질의 디렉토리
스팸성 디렉토리는 여러분의 백링크 프로필에서도 배제해야 합니다. 좋은 소식은, 여전히 고품질인 웹사이트이거나 틈새시장과 관련된 몇 가지 디렉토리를 가지고 있다면 그 안에 배치된 링크는 어떠한 방식으로든 웹사이트를 돕는다는 것입니다. 나쁜 소식은, 높은 입/출력 비율과 PR 통계가 있는 디렉토리를 볼 때 염려해야 한다는 것입니다. 이는 누구나 링크를 제출하고 무료로 사용할 수 있음을 의미합니다.
그러나 검색 쿼리가 높은 머니(Money) 앵커 텍스트를 사용하여 리스트를 배치할 수 있는 모든 디렉토리를 피하세요. 또한 모든 링크가 허용되는 디렉토리의 특정 틈새는 피하는 것이 좋습니다.
5. 스팸성 높은 블로그는 키워드 및 블로그 네트워크로만 가득 채워져 있습니다.
스팸성 있는 블로그는 링크를 다른 웹사이트에 연결하여 구글 검색 순위, 즉 SERP를 조작하기 위한 목적으로 만들어졌습니다. 보통 스폴로그(Splogs)라고 불립니다. 이 블로그들은 지나치게 최적화된 머니 앵커 텍스트로 연결된 몇몇 외부 링크(Outgoing Link)에서 오로지 키워드로만 채워진 콘텐츠를 배포합니다. 이러한 종류의 블로그는 일반적으로 불법적이거나 비도덕적인 웹사이트 링크를 포함하고 있어 스팸으로 분류되기 쉽습니다. 또한 필자 정보도 거의 없습니다. 있다 하더라도 대부분 가짜 정보일 경우가 많습니다.
6. 저품질 보도자료 및 웹 신디케이션
대부분의 보도자료 웹사이트는 여러분의 프로필에서 즉시 거부해야 합니다. 왜냐하면 수많은 미디어로 배포된 홍보 콘텐츠는 내용이 중복되기 때문이며, 링크의 두-팔로우 태그에서 링크 주스를 다른 웹사이트로 전달하기 때문입니다. 따라서 언론사 웹사이트는 여러분의 검색 순위에 도움을 주지 않습니다. 거부 파일(disavow file)에 확실히 추가해야 합니다.
7. 링크 리스트 하기
링크 리스트는 다른 하위 도메인에서 자동으로 많은 백링크(일반적으로 두-팔로우 링크)를 생성하는 웹사이트입니다. 때로는 블로그 플랫폼에서도 생성됩니다(일반적으로 blogspot.com). 그것들은 어떠한 가치도 갖고 있지 않으며, 보통 동일한 IP 주소에서 옵니다. 구글은 이러한 종류의 웹사이트가 배포하는 스팸에 대해서 알고 있지만, 이 역시 거부 파일에 추가하는 것이 좋습니다.
8. 소셜 북마크 & 공유 사이트
물론 여러분의 링크 프로필에는 보관할 가치가 있는 소셜 북마크 웹사이트들이 있을 겁니다. 하지만 웹 전체에는 여러분의 거부 파일에 포함되어야 하는 낮은 품질의 소셜 및 북마크 공유 웹사이트들도 많이 있습니다. 확실한 것은 이러한 스팸성 북마크 웹사이트의 경우 매우 유사한 템플릿을 보여준다는 점입니다. 이는 더 큰 링크 스키마(linking scheme)의 일부분이라는 점을 의미할 수 있겠지요.
9. 백링크의 품질을 평가할 때
- 링크된 웹사이트에 색인이 생성되어 있는지 확인하십시오. 그렇지 않으면 해당 사이트가 구글의 검색 결과에서 삭제되고 있음을 나타낼 수 있습니다(이를 확인하기 위해 “site” 사이트 연산자(search operator)를 사용하십시오).
- 연결된 웹사이트가 바이러스로 방문자를 감염시키려고 하면, 도메인 수준에서 항상 이러한 종류의 도메인을 거부해야 합니다.
- 웹사이트의 출처가 합법적인지 확실치 않은 경우, 웹사이트의 IP와 DNS를 검색하십시오. 스팸성 웹사이트가 더 큰 링크 스키마의 일부분일 경우도 있습니다. 여기서는 View Dns 도구를 추천합니다.
- 항상 in/out 연결 비율을 알고 있어야 합니다. 비율이 높으면(웹사이트에 하이퍼링크가 매우 많이 걸려 있음) 링크팜 가능성이 커집니다.
- 악성 백링크를 구글에서 무시하도록 하려면, 여러분의 거부 파일에 이를 추가해야 합니다.
10. 거부 파일(disavow file) 만들기
- 일단 여러분의 웹사이트로 향하는 백링크를 발견하였나요? 그렇다면 부자연스러운 백링크를 제거해야 합니다. 거부 파일에 백링크를 추가하기 전에, 해당 링크가 있는 웹사이트 운영자에게 연락하여 먼저 제거해줄 것을 요청하십시오. 물론 이 방법은 실패할 확률이 높을 것입니다.
- 웹사이트 운영자를 통해 링크를 제거할 수 없는 경우, 거부 파일을 만드십시오. TF-8 또는 7 비트 ASCII 형식의 .txt 파일을 만들고 구글이 무시할 모든 도메인 또는 URL에 한 줄당 하나의 도메인/URL을 복사하여 붙여 넣어야 합니다.
- 도메인 수준에서(예: domain : spammysiteexample.com) 이러한 백링크를 거부하는 것이 좋습니다. 도메인에서 오는 새롭고 비정상적인 링크나 누락되고 부자연스러운 링크로 인해 여러분의 웹사이트가 피해를 입지 말라는 법이 없기 때문입니다. 어떠한 이유로든 현재 도메인을 유지하려는 경우(때로는 도메인이 좋은 링크와 나쁜 링크를 모두 전송할 수 있음), 특정 URL을 거부하십시오. 이 경우 전체 URL을 복사하여 .txt 거부 파일에 별도의 줄에 붙여 넣기 만하면됩니다.
거부 파일을 준비하고 나면 구글의 링크 거부에 이를 추가할 차례입니다.
이제 웹사이트를 선택하고 링크 거부를 클릭한 다음에 최근에 만든 .txt 파일을 선택하십시오. 거부 파일에 새로운 도메인이나 URL을 추가하려는 경우 거부된 이전 도메인이 여전히 거부.txt 파일에 있는지 확인해야 합니다(일단 구글에 업로드한 .txt 거부 파일을 다시 사용하고 새 줄에 새 URL 혹은 도메인을 추가해야 합니다).
11. 거부 파일을 만들 때 피해야 할 일반적인 실수
거부 파일을 만들고 업로드하는 것은 매우 중요한 작업이기 때문에, 아래와 같은 실수들은 피하는 것이 좋습니다.
A. 거부 파일에 좋은 링크 추가하기
가장 일반적인 실수는 사람들이 구글 거부 도구에 좋은 링크를 포함시키는 것입니다. 이런 일이 발생하면 거부 파일에서 해당 파일을 삭제한 다음 파일을 다시 업로드하면 됩니다. 그러나 구글이 거부된 도메인과 URL을 다시 크롤링하기 시작하기 전까지는 시간이 조금 걸립니다.
B. TXT 파일 대신 .CSV 또는 .DOC 파일 업로드
거부 파일은 UTF-8 또는 7 비트 ASCII 형식의 일반 텍스트 (.txt 파일)로 만들어야합니다.
C. COMMENT = SYNTAX 오류 앞에 “#”을 사용하지 않고 .TXT 파일에 주석 달기
코멘트가 삽입될 모든 행의 시작 부분에 “#”을 사용해야 합니다. 거부된 역 링크에 대한 의견은 구글 로봇에 의해 표시되어서는 안됩니다.
마무리
여러분의 순위를 향상시키는 데 도움이 될 수 있기 때문에, 깨끗한 백링크 프로파일을 가지고 이에 따라서 살펴본 뒤 나쁜 것들을 없애고 자연스러운 링크를 얻어야 합니다. 이는 포스트 펭귄 시대에서 중요한 점 중 하나입니다.
여러분의 웹사이트로 연결되는 백링크를 살펴볼 때 가능한 한 많은 데이터 소스에서 데이터를 수집하십시오. 링크 프로파일에서 전체적인 그림을 제공하며, 백링크의 중요한 부분도 분석하고 평가할 수 있습니다. 백링크를 확인한 후에는 구글 거부 도구에서 불량 링크를 거부해야 합니다. 이런 행동은 Off page SEO 활동이 구글 순위 하락을 유발하지 않을 것이라는 좋은 확신을 줍니다.
원문: Digital Marketing Curation
참고
표지 이미지 출처