Bui Vietđăng trongTài liệu>Seo
10/09/2018
21 lượt đánh giá
5.0 5 21

Nguyên nhân và cách xử lý trùng lập nội dung website

Nội dung trùng lập là gì?

Trùng lập nội dung xảy ra khi một nội dung xuất hiện ở nhiều nơi trên mạng Internet. Mỗi nội dung sẽ được google gắn một địa chỉ URL duy nhất do đó nếu 1 nội dung xuất hiện ở nhiều URL thì website sẽ bị đánh giá có nội dung trùng lập.

Nội dung trung lập sẽ ảnh hướng đến thứ hạng từ khóa tự nhiên của website trên các công cụ tìm kiếm. Khi có một truy vấn liên quan đến nội dung bị trùng lập google sẽ lựa chọn Url có tương tác, khả năng điều hướng để đựa ra một URL duy nhất trả về cho truy vấn của người dùng.

 

Tại sao cần loại bỏ nội dung trùng lập?

Đối với công cụ tìm kiếm

  1. Google không biết nên loại bỏ và giữ lại URL nào trong chỉ mục.
  2. Google không thể tổng hợp  các chỉ số để xếp hạng như độ tin cậy,văn bản liên kết, back link... Cho 1 link duy nhất hay chia đều cho các phiên bản nội dung khác.
  3. Google không biết phiên bản nào là tốt nhất để xếp hạng cho kết quả truy vấn.

Đối với nhà quản trị web

  1. Website có nội dung trùng lập sẽ bị giảm xếp hạng trên công cụ tìm kiếm từ đó giảm bớt lưu lượng truy cập. Những nguyên nhân chính gây ra việc này:
  2. Để mang lại trải nghiệm tốt nhất cho người dùng, các công cụ tìm kiếm mặc định chỉ chọn một phiên bản nội dung tốt nhất và loại bỏ các phiên bản khác trong kết quả trả về cho truy vấn. Điều này làm giảm khả năng xếp hạng của mỗi bản sao nội dung.
  3. Link equity (mạng lưới liên kết) thay vì trỏ đến một website bây giờ các liên kết trỏ đến nhiều trang có trung một nội dung do dó sức mạnh của liên kết cũng giảm. Bởi vì các liên kết là một trong những yếu tốt xếp hạng quan trọng, nên điều này sẽ gây ảnh hưởng đến thứ hạng tìm kiếm.

 

Vì sao website bị trùng lập nội dung?

  1. Các Thông số trong url

URL thường chứa các thông số để nhà quản trị website có thể phân tính hiệu quả nhấp chuột, truy vấn tìm kiếm... Điều này vô tình tạo ra trùng lặp nội dung trên website.

Ví dụ:

www.widgets.com/blue-widgets?color=blue là bản sao của www.widgets.com/blue-widgets

www.widgets.com/blue-widgets?color=blue&cat=3 là bản sao của www.widgets.com/blue-widgets?cat=3&color=blue

Session ID cũng là một nguyên nhân phổ biến gây nên lỗi trung lập. Điều này xảy ra khi mỗi người dùng truy cập website được chỉ định một ID khác nhau trên url. Tuy việc này giúp tối ưu hóa chuyển đổi nhờ vào tối ưu hóa đường dẫn chuyển đổi nhưng cần có phương pháp khắc phục tình trạng trùng lập này.

Các phiên bản nội dung dành riêng cho máy in cũng có thể gây trùng lập.

  1. Cài đặt HTTP – HTTPS hoặc WWW – Non WWW

Nếu website của bạn chuyển đổi từ WWW thành Non WWW và HTTP – HTTPS với nội dung giống nhau ở cả 2 phiên bản. Bạn vô tình khiến website của mình gặp phải tình trạng trung lập nội dung bởi google sẽ tự động thu thập thông tin của tất cả các trang.

  1. Trùng lập nội dung sản phẩm

Trùng lập nội dung sản phẩm là một hình thức trùng lập phổ biến thường xảy ra nhất. Nguyên nhân chính do nhiều website bán cùng một sản phẩm và sử dụng mô tả của nhà sản xuất để nhập lên website.

 

Cách khắc phục tình trạng trùng lập nội dung

Bước đầu tiên cũng là quan trọng nhất trong việc xử lý trùng lập nội dung là xác định nội dung nào là tốt nhất. Sau dó bạn có thể áp dụng một trong ba cách chính dưới đây để xử lý hoặc sử dụng công cụ google search console.

301 redirect

Trong nhiều trường hợp, cách tốt nhất là sử dụng 301 redirect để thiết lập chuyển tư trang có nội dung trùng lập sang trang nội dung gốc.

Khi nhiều trang có cùng nội dung được chuyển hướng về 1 trang duy nhất không chỉ dừng cạnh tranh thứ hạng giữa các trang này mà còn được các công cụ tìm kiếm đánh giá cao. Điều này giúp website có khả năng tăng thứ hạng.

 

Rel = "canonical"

Một phương pháp khác là sử dụng thuốc tính Rel = "canonical" thông báo cho các công cụ tìm kiếm biết trang đang truy cập là một sản sao của url được chỉ định trong thẻ Rel = "canonical". Điều này giúp công cụ tìm kiếm tăng điểm số của trang gốc.

Thuộc tính Rel = "canonical” thường nằm trong thẻ <head> và có cấu trúc như sau

<head>

... [mã html] ...

<link href = "URL của trang gốc" rel = "canonical" />

... [Mã html] ...

</ head>

Thuộc tính Rel = "canonical" phải được thêm ở trước thẻ </head> của mỗi trang bị trùng lập nội dung. Với phần "URL của trang gốc" là url chính. Tác dụng của thẻ Rel = "canonical" tương đương với Redirect 301 nhưng thẻ canonical được thực hiện ở cấp độ page nên mất ít thời gian để thực hiện hơn.

 

Meta Robot Noindex

Một thẻ meta có thể đặc biệt hữu ích trong việc xử lý nội dung trùng lặp là meta robot với nội dung "noindex, follow". Thẻ này được thêm vào trước thẻ </head> để các công cụ tìm kiếm không lập chỉ mục url đang truy cập.

Ví dụ:

<head>

... [mã html] ...

<meta name = "robots" content = "noindex, follow">

... [mã html] ...

</ head>

Ý nghĩa của thẻ robot trên là cho phép các công cụ tìm kiếm thu thập các dữ liệu liên kết trên trang nhưng không index url đang truy cập vào chỉ mục tìm kiếm.

Ưu điểm của thẻ robot ở đây là những trang trùng lập vẫn được thu thập dữ liệu mặc dù google sẽ không lập chỉ mục url. Phương pháp này là giải pháp đặc biệt để giải quyết vấn đề phân trang.

 

Cái đặt trên miền ưu thích và tốc độ thu thập dữ liệu trong google search console

Google Search Console cho phép bạn đặt tên miền ưa thích của trang web của bạn (ví dụ: http://doamin.com thay vì http://www.domain.com) và tốc độ thu thập dữ liệu trên website của bạn

 

Các phương pháp xử lý trùng lập nội dung khác

  1. Tạo tên miền chính cho toàn bộ website. Ví dụ: Website cài đặt tên miền ưa thích là domain.com thì toàn bộ liên kết nội bộ, backlink sẽ trỏ về link có dạng http://domain.com thay vì trỏ về trang http://www.domain.com.
  2. Khi tạo nội dung mới bạn cần đảm bảo mọi liên kết đều trỏ về nội dung gốc chứ không phải các biến thể khác trên website.
  3. Một phương pháp khác giúp tăng độ uy tí của bài viết trước tình trạng ăn cắp nội dung là thêm thẻ rel=canonical với URL là chính nó. Đây còn là một phương pháp hữu hiệu chống lại việc các seo mũ đen ăn cắp nội dung đi trên các diễn đàn, blog, website vệ tinh...
Bình luận
Bài viết ngẫu nhiên
Bí Ngôđăng trongTài liệu>Marketing
16/11/2018
3 Sai lầm cần tránh khi làm Digital Marketing
3 Sai lầm cần tránh khi làm Digital Marketing
Khi các cuộc chiến marketing ngày càng cạnh tranh khốc liệt thì doanh nghiệp và các công ty đua nhau đưa ra những chiến lược digital marketing hấp dẫn, nhằm thu hút khách hàng và cạnh tranh với đối thủ. Các ch...
0 8071
1 lượt đánh giá
Mai Huỳnhđăng trongTài liệu>Seo
21/09/2018
Hiểu rõ hơn về Backlink
Hiểu rõ hơn về Backlink
Backlink là gì? Backlink còn được gọi là inbound link hay incoming link, được tạo ra khi một website có liên kết với một site khác. Nói dễ hiểu, backlink là một liên kết ngoài của một site khác trỏ tới site của bạn. ...
0 2661
22 lượt đánh giá
Mai Huỳnhđăng trongTài liệu>Seo
03/10/2018
Thẻ mô tả trong SEO
Thẻ mô tả trong SEO
Khi nhắc đến yếu tố content trong SEO, người ta thường chỉ nghĩ đến các nội dung hiển thị trên trang mà ít khi nghĩ đến các nội dung trong code HTML. Dĩ nhiên đọc tiêu đề là mọi người đã biết tôi đang đang nói về thẻ mô...
0 13650
4 lượt đánh giá
Bí Ngôđăng trongTài liệu>Thiết kế website
27/12/2018
Công cụ trực tuyến giúp xóa phông nhanh cho ai không biết Photoshop
Công cụ trực tuyến giúp xóa phông nhanh cho ai không biết Photoshop
Remove.Bg là một công cụ trực tuyến sử dụng AI giúp người dùng xóa phông nền hình ảnh. Đây là một công cụ hoàn toàn miễn phí cho nên các bạn chỉ cần truy cập vào website remove.bg sau đó click vô "Select a photo" hoặc...
0 7249
1 lượt đánh giá
Bí Ngôđăng trongTài liệu>Marketing
18/10/2018
Các hình thức quảng cáo thông dụng trên facebook
Các hình thức quảng cáo thông dụng trên facebook
Với đại đa số các doanh nghiệp hiện nay, mỗi khi thực hiện một chiến dịch quảng bá sản phẩm thì thì hình thức mà họ nghĩ đến đầu tiên sẽ là quảng cáo trên Facebook Vì thế trong bài viết này chúng ta sẽ cùng tìm hiểu về...
0 13788
16 lượt đánh giá
Copyright © 2018 Spineditor