Các vấn đề trùng lặp nội dung và cách khắc phục

Kiến thức SEO
Hot!
(ngày đăng: 27/01/2014 - Số lần xem: 866)
Chúng ta đều biết rằng trùng lặp nội dung là một điều không tốt phải không? Nhưng nó là gì và tại sao nó lại không tốt?


Để hiểu được đầy đủ vấn đề trùng lặp nội dung, chúng ta cần phải nhìn vào nó không phải theo góc độ của người sở hữu trang web mà theo cách nhìn của công cụ tìm kiếm để cố gắng cung cấp trải nghiệm tốt nhất có thể cho người sử dụng nó. Từ quan điểm chính mà chúng tôi có thể thực hiện các nguyên tắc để xem xét làm thế nào nó ảnh hưởng đến một trang web và lưu lượng truy cập.

Tìm hiểu về nội dung trùng lặp

Nội dung trùng lặp là nội dung xuất hiện nhiều hơn một vị trí trên Internet. Ví dụ một bài viết về vật dụng màu xanh được viết bởi Bill trên abcwidgets.com. Tôi chạy xyzwidgets.com và tôi cũng thực sự thích bài viết này. Với sự cho phép của Bill, tôi sao chép bài viết của anh ấy vào trang web của tôi để làm tài liệu tham khảo phù hợp. Điều đó có gì sai? Về mặt pháp lý, đạo đức và thậm chí từ một quan điểm kinh doanh thì không có gì đáng phải chú ý.

Trong ví dụ này, tôi thấy nội dung rất hữu ích và tôi muốn chia sẻ nó với độc giả của riêng tôi nhưng tôi cũng muốn giữ chúng trên trang web của tôi. Nhưng điều gì sẽ xảy ra khi tôi xem cùng một kịch bản từ quan điểm của một công cụ tìm kiếm?

Câu hỏi đó đã được đặt ra ngay sau đó, trong hai bài viết này, bài nào xứng đáng để xếp hạng và làm thế nào để các công cụ tìm biết?



Trùng lặp nội dung


Nhiều yếu tố vào cuộc tại thời điểm này – số lượng nội dung trùng lặp trên trang và trên các trang web như một sức mạnh tổng thể của các trang web và bản sao mà nó được xem đầu tiên. Nhưng vấn đề cốt lõi là tôi luôn giả định các yếu tố (được xem đầu tiên) được tuyên dương. Vậy điều gì sẽ xảy ra với các trang web với các trang trùng lặp?

- Nó sẽ không xếp hạng cho trang đó.
- Trọng số của trang đó sẽ không đáng kể.
- Một điểm chống lại các trang web như là một nguồn đáng tin cậy về chất lượng, nội dung duy nhất sẽ được đăng ký.

Bây giờ, điều này có vẻ không công bằng nhưng chúng ta phải nhớ rằng ví dụ trên không phải là tổng số tất cả những gì động cơ phải đối phó. Dưới đây chúng tôi sẽ thảo luận một số vấn đề nội dùng trùng lặp có “đạo đức” nhưng điều quan trọng phải nhớ rằng không phải tất cả các chiến lược đã được sử dụng là tốt nhất cho người tìm kiếm hoặc thậm chí là khách truy cập.

Toàn bộ mạng lưới các trang web đã được xây dựng mà chỉ tập trung vào nội dung được tìm thấy ở nơi khác sao chép trên các trang web với hy vọng thu hút lưu lượng tìm kiếm. Chúng không được xây dựng để tăng thêm giá trị.

Chỉ cần xem xét bài viết đó có cung cấp thông tin sai để che mắt công cụ tìm kiếm, cùng một nội dung xuất hiện trên hàng trăm trang web hoặc không có kiểm soát chất lượng với nội dung trên một phạm vi lớn của các đối tượng. Về cơ bản chúng tôi đã có các trang không có giá trị cho người sử dụng và thậm chí ít hơn vì tất cả những nỗ lực đều bị Google tiêu tan bởi hệ thống các trò chơi cho các liên kết và các trang bài viết để thu hút lưu lượng truy cập cho những quảng cáo ấn tượng của họ.

Để đối phó với tất cả các vấn đề này, công cụ tìm kiếm đã phải điều chỉnh theo cách mà chúng có giá trị nội dung trùng lặp. Hãy nhớ rằng, chúng phải sử dụng thuật toán để tìm ra các trang có nội dung trùng lặp.

Vì vậy, chúng ta không tranh luận với các công cụ tìm kiếm về việc ai đúng ai sai mà chúng ta cần phải đảm bảo rằng ngay cả khi những gì chúng tôi đang làm là đúng cho khách truy cập, rằng nó không thể bị nhầm lẫn với một cái gì đó. May mắn là có những phương pháp thực hiện để đối phó với sự đa dạng các loại nội dung trùng lặp. Vì vậy, bạn hãy thử tìm hiểu chúng.

Một mảng rộng các loại nội dung trùng lặp là phần lớn các trang web có chứa một hoặc một số. Ở đây, chúng ta sẽ xem xét các loại nội dung trùng lặp phổ biến nhất và thảo luận xem làm thế nào để giải quyết chúng và điều này rất có ý nghĩa cho các chủ sở hữu trang web.

Copy trang

Tình huống: Hãy bắt đầu với ví dụ trên của tôi. Tôi là một chủ sở hữu trang web và đã tìm thấy nội dung trên một trang web khác và tôi muốn chia sẻ trên trang web của tôi.

Vấn đề: bạn sẽ phải đối mặt với nội dung không được đánh giá cao và có thể góp phần làm giảm chất lượng trên một số lĩnh vực tổng thể.

Cách khắc phục: thẻ canonical cross-domain là cách khắc phục duy nhất ở đây. Bạn sẽ cần phải thêm một thẻ canonical để trang chỉ ra rằng nguồn gốc của nội dung này là ở một địa điểm khác.

Điều này sẽ cho công cụ biết rằng bài viết nào được sao chép, nó cố tình được đặt trên trang web của bạn và tất cả trọng số liên kết đến trang đó sẽ vượt qua vị trí ban đầu của bài viết.

Nhược điểm: tất cả các trọng số liên kết sẽ được chuyển đến cho bài viết gốc. Nếu bạn có 10 liên kết nội bộ trên một trang và trỏ đến một trang canonicalized thì bạn sẽ chỉ giữ lại 90% trọng số. Điều đó nói rằng, nếu nội dung là rất hữu ích để truy cập thì lòng trung thành sẽ vượt qua được rào cản PageRank.

Trùng lặp thông tin sản phẩm

Tình huống: bạn đang chạy một trang web thương mại điện tử và bán các vật dụng của các nhà sản xuất khác nhau. Các nhà sản xuất cung cấp cho bạn thông tin sản phẩm (tiêu đề, mô tả, thông số kỹ thuật và hình ảnh) để đăng trên trang web của bạn.

Vấn đề: các nhà sản xuất cũng cung cấp các thông tin chính xác để tất cả mọi người bán sản phẩm của họ.

Cách khắc phục: trong khi các thông số kỹ thuật vẫn như cũ và việc sao chép trên nhiều trang web được coi là có thể chấp nhận được, bạn cần phải thiết lập bên ngoài trang web. Điều này thường sẽ liên quan đến nội dung giới thiệu sản phẩm mới, chụp ảnh mới và hy vọng thêm nội dung duy nhất cho trang web như kiểu đánh giá của bạn dành cho sản phẩm đó.

Nhược điểm: nhược điểm duy nhất ở đây là thời gian. Phải mất nhiều thời gian để viết mô tả sản phẩm nhưng nếu nó không có giá trị thời gian thì người ta phải tự hỏi nếu sản phẩm có giá trị trên tất cả các trang web (nếu thu nhập ban đầu của sản phẩm đó là rất thấp thì nó có thực sự mang lại lợi nhuận không?).

Sắp xếp nhiều trang sản phẩm

Tình huống: bạn chạy một trang web thương mại điện tử và trang web đó tạo ra URL duy nhất hoặc có nhiều trang chứa các sản phẩm chính để phân loại. Ví dụ như eBay, họ có số lượng lớn các trang sản phẩm ở hầu hết các hạng mục, sau đó thay đổi đơn đặt hàng (hoặc các sản phẩm trong danh sách) tùy thuộc vào cách danh sách được đặt hàng.

Vấn đề: nếu một trang có 20 hạng mục và một URL khác được tạo ra khi những mặt hàng đều được sắp xếp theo giá sau đó thực chất là bạn kết thúc bằng 2 trang với nội dung giống nhau ở các URL khác.

Cách khắc phục: chúng ta vẫn phải sử dụng giải pháp là thẻ canonical. Đối với mỗi trang là một trang phụ, ban đầu bạn có thêm thẻ canonical đến URL ban đầu. Điều này đảm bảo rằng chúng không được đưa vào nội dung trùng lặp và tiếp tục đảm bảo tất cả các trọng số liên kết được đi đúng hướng.

Nhược điểm: khi lần đầu tiên giải quyết vấn đề trùng lặp nội dung, chiến lược này cũng sẽ đảm bảo bất kỳ trọng số được truyền cho trang phụ trong các tùy chọn phân loại (hoặc liên kết nội bộ từ bên ngoài) sẽ được chuyển lại cho các trang chuyên mục chính đến một trang đích.

Vấn đề: Trong khi các công cụ tìm kiếm nói chung là tốt thì nó cũng không phải là một ý tưởng tốt để dựa vào. Điều này có thể tạo ra nội dung trùng lặp và cũng gây ra các liên kết đến URL sai, không được ghi vào trang web của bạn một cách chính xác.

Cách khắc phục: trong khi thẻ canonical có thể khắc phục lỗi này thì cũng có một con đường tốt hơn là chuyển hướng 301 đến một vị trí phù hợp. Điều này sẽ đảm bảo rằng tất cả các yêu cầu chuyển hướng đến vị trí tương tự.

Các máy chủ khác nhau có phương pháp khác nhau cho việc này. Khi có nhiều những thứ khác bạn muốn để hoàn thành (chuyển hướng tập tin index.html vào thư mục gốc của tất cả các thư mục), bạn có thể truy cập vào đây. Hầu hết các code có thể được tìm thấy ở đây.

Các đoạn code cho các máy chủ Apache. Nếu trang web của bạn được lưu trữ trên máy chủ của Windows thì tôi khuyên bạn nên nói chuyện với admin hệ thống vì nó sẽ yêu cầu truy cập IIS cho một số chức năng nâng cao.

Nhược điểm: có một lượng nhỏ link juice chuyển hướng 301 làm giảm trọng số được truyền cho các trang mục tiêu. Vì lý do đó, ngay cả với thẻ canonical chuyển hướng 301 tại chỗ và điều quan trọng để đảm bảo rằng tất cả các liên kết nội bộ hoặc liên kết bạn tạo ra trỏ đến URL mong muốn bất cứ khi nào có thể.

Kết luận

Miễn là bạn nhận thức được các vấn đề trùng lặp nội dung thì không có gì phải sợ hãi. Nó xảy ra và Google cũng biết điều đó xảy ra (thậm chí vô tình).

Đảm bảo rằng bạn có thể làm mọi việc để có thể chiếm quyền sở hữu để làm sao cho trọng số và thẩm quyền vượt qua được nội dung trùng lặp. Hơn nữa, giải quyết nội dung trùng lặp sẽ giúp đảm bảo trọng số đạt hiệu quả thông qua trang web mà bạn ưu tiên cho các trang chính xác.

Trong khi nhiều người phải mất thời gian sửa lỗi thì bạn có thể làm bất cứ điều gì đúng miễn là không vi phạm bất cứ nguyên tắc nào của công tụ tìm kiếm. Khắc phục các vấn đề trùng lặp nội dung có thể rạo ra một số ROI lớn nhất trong vòng 1 giờ đồng hồ - chiếm tỷ lệ rất ít trong hầu hết các hoạt động SEO.
 

ArtSeed Design (Nguồn: thegioiseo.com)

Copyright © ArtSeed Design 2011. All Rights Reserved SEO by Eric Doan

ArtSeed Design 'Tỏa sáng thương hiệu, đỉnh điểm thành công'

CHIẾN LƯỢC SEO VÀ ONLINE MARKETING CHUYÊN NGHIỆP