10/10/2018, 11:09

Google bot - những con bọ làm cản bước tiến công nghệ web

Từ trước tới nay, những người lập trình web luôn cải tiến kỹ thuật nhằm thu hẹp tối đa khoảng cách giữa Web Application (WA) và Desktop Application (DA), tạo cho người duyệt web một cảm giác không còn rào cản về thời gian, giống như đang thao tác trên một Desktop Appplication thực thụ.

Và trong nỗ lực không ngừng, Jesse James Garrett đã đưa ra một kỹ thuật mang tính đột phá, đó chính là kỹ thuật ajax. Với kỹ thuật này, việc truyền dữ liệu giữa client và server không còn là vấn đề, và mang lại cảm giác "as soon as click".

Việc áp dụng kỹ thuật này kết hợp với thuật toán đoán trước những gì sẽ xảy ra tiếp theo những tưởng sẽ đạt kết quả khả quan cho mơ ước xóa bỏ rào cản giữa WA và DA (Tôi đã từng áp dụng và cũng đạt kết quả mỹ mãn)

Thế mà đùng một cái, người ta phát hiện ra rằng những con bọ ngu ngốc mà Google thả vô (Google Bot) chỉ quan tâm nhiều đến httprequest mà bỏ qua scriptRequest. Kết quả là người ta chỉ quan tâm tới việc làm thế nào để tạo ra những url thật "thân thiện với SEO" mà không hề quan tâm chút gì đến những thao tác trên web. Thay vì hạn chế tối đa request đến server (nhằm giảm tải cho server và giảm thời gian chờ cho user) thì người ta lại đi làm ngược lại, tăng cường tối đa httprequest để đánh lừa Google Bot. Hậu quả là người dùng phải chờ đến vài phút chỉ để browser thay đổi vài dòng nội dung. (Mà lẽ ra chỉ cần chưa tới 1 giây)

Và chắc mọi người cũng dễ dàng nhận ra phong trào "nhà nhà cùng SEO, người người cùng SEO". Nếu cứ như thế này thì không biết Web Appplication sẽ đi về đâu?
hoabinh viết 13:24 ngày 10/10/2018
vì google ko thể nhận biết đc scriptRequest cho nên 1 số site sử dụng cùng 1 lúc cả 2 kiểu Request ví dụ như Facebook hay code forum VBB
Còn chuyện tại sao em google bot vẫn chưa hiểu đc script Request thì đơn giản vì nó quá phức tạp, để hiểu đc các truy vấn của script đòi hỏi khả năng đọc hiểu cách viết của script, trong khi 1 số script viết quá phức tạp. Nếu 1 con bot có khả năng đọc hiểu toàn bộ các viết script của loài người thì con bot đó phải nặng bao nhiêu ? 1GB hay 10GB , nếu 1 ngày chừng 10 con như thế vào thì những site vừa và nhỏ sẽ chịu không nổi? Google sẽ không điên như thế. Mặt khác các nhà phát triển web thông minh sẽ lợi dụng luôn cả 2 giao thức request, bên phần end-user font họ vẫn sài ajax nhưng mặt khác vẫn tạo httprequest để các chú bot có thể hiểu.
Chẳng hiểu có phải bạn học quá nhiều nên mới suy nghĩ thiếu logic như vậy không hoặc có lẽ bạn sẽ là thiên tài khi viết ra 1 con bot hiểu script chỉ năng 1kb
chameron viết 13:17 ngày 10/10/2018
conbot đấy chạy bằng cơm em đùa tí , chứ chả hiểu gì
xcode viết 13:10 ngày 10/10/2018
Được gửi bởi thuyduongcd
Từ trước tới nay, những người lập trình web luôn cải tiến kỹ thuật nhằm thu hẹp tối đa khoảng cách giữa Web Application (WA) và Desktop Application (DA), tạo cho người duyệt web một cảm giác không còn rào cản về thời gian, giống như đang thao tác trên một Desktop Appplication thực thụ.

Và trong nỗ lực không ngừng, Jesse James Garrett đã đưa ra một kỹ thuật mang tính đột phá, đó chính là kỹ thuật ajax. Với kỹ thuật này, việc truyền dữ liệu giữa client và server không còn là vấn đề, và mang lại cảm giác "as soon as click".

Việc áp dụng kỹ thuật này kết hợp với thuật toán đoán trước những gì sẽ xảy ra tiếp theo những tưởng sẽ đạt kết quả khả quan cho mơ ước xóa bỏ rào cản giữa WA và DA (Tôi đã từng áp dụng và cũng đạt kết quả mỹ mãn)

Thế mà đùng một cái, người ta phát hiện ra rằng những con bọ ngu ngốc mà Google thả vô (Google Bot) chỉ quan tâm nhiều đến httprequest mà bỏ qua scriptRequest. Kết quả là người ta chỉ quan tâm tới việc làm thế nào để tạo ra những url thật "thân thiện với SEO" mà không hề quan tâm chút gì đến những thao tác trên web. Thay vì hạn chế tối đa request đến server (nhằm giảm tải cho server và giảm thời gian chờ cho user) thì người ta lại đi làm ngược lại, tăng cường tối đa httprequest để đánh lừa Google Bot. Hậu quả là người dùng phải chờ đến vài phút chỉ để browser thay đổi vài dòng nội dung. (Mà lẽ ra chỉ cần chưa tới 1 giây)

Và chắc mọi người cũng dễ dàng nhận ra phong trào "nhà nhà cùng SEO, người người cùng SEO". Nếu cứ như thế này thì không biết Web Appplication sẽ đi về đâu?

những con bọ ngu ngốc mà Google thả vô

Vậy, Với một cái đầu "thông minh" như bạn, bạn có thể tạo ra những cái ngu ngốc đó không?

Chẳng hiểu sao facebook đạt Google PR10
khonggiannet viết 13:15 ngày 10/10/2018
Được gửi bởi thuyduongcd
Từ trước tới nay, những người lập trình web luôn cải tiến kỹ thuật nhằm thu hẹp tối đa khoảng cách giữa Web Application (WA) và Desktop Application (DA), tạo cho người duyệt web một cảm giác không còn rào cản về thời gian, giống như đang thao tác trên một Desktop Appplication thực thụ.

Và trong nỗ lực không ngừng, Jesse James Garrett đã đưa ra một kỹ thuật mang tính đột phá, đó chính là kỹ thuật ajax. Với kỹ thuật này, việc truyền dữ liệu giữa client và server không còn là vấn đề, và mang lại cảm giác "as soon as click".

Việc áp dụng kỹ thuật này kết hợp với thuật toán đoán trước những gì sẽ xảy ra tiếp theo những tưởng sẽ đạt kết quả khả quan cho mơ ước xóa bỏ rào cản giữa WA và DA (Tôi đã từng áp dụng và cũng đạt kết quả mỹ mãn)

Thế mà đùng một cái, người ta phát hiện ra rằng những con bọ ngu ngốc mà Google thả vô (Google Bot) chỉ quan tâm nhiều đến httprequest mà bỏ qua scriptRequest. Kết quả là người ta chỉ quan tâm tới việc làm thế nào để tạo ra những url thật "thân thiện với SEO" mà không hề quan tâm chút gì đến những thao tác trên web. Thay vì hạn chế tối đa request đến server (nhằm giảm tải cho server và giảm thời gian chờ cho user) thì người ta lại đi làm ngược lại, tăng cường tối đa httprequest để đánh lừa Google Bot. Hậu quả là người dùng phải chờ đến vài phút chỉ để browser thay đổi vài dòng nội dung. (Mà lẽ ra chỉ cần chưa tới 1 giây)

Và chắc mọi người cũng dễ dàng nhận ra phong trào "nhà nhà cùng SEO, người người cùng SEO". Nếu cứ như thế này thì không biết Web Appplication sẽ đi về đâu?
Làm gì mà chênh nhau giữa vài phút với 1 giây - có bốc phét quá không bạn?

Nếu như bạn cho rằng dùng AJAX làm cho Google Bot không index được thì đó là vì bạn không biết cách dùng AJAX. Hãy xem ví dụ sau của tôi nhé:

Code:
<script>
function sendAjaxRequest(){
// do someting here
}
</script>

<a href="/example.html" onClick="sendAjaxRequest(); return false;">Example</a>
Google Bot hoặc browser với javascript đã được tắt sẽ xem trang web trên là một trang HTML với hyperlink thông thường. Nếu user truy cập với browser đã bật JS thì nội dung sẽ được load bằng kĩ thuật AJAX. Thế có phải là vừa đảm bảo tính userbility và vừa đảo bảo SEO không.
Hanaziki viết 13:11 ngày 10/10/2018
Được gửi bởi khonggiannet
Nếu như bạn cho rằng dùng AJAX làm cho Google Bot không index được thì đó là vì bạn không biết cách dùng AJAX.
Chuẩn không cần chỉnh luôn. (về kỹ thuật SEO)
em_bé viết 13:15 ngày 10/10/2018
Được gửi bởi khonggiannet
Google Bot hoặc browser với javascript đã được tắt sẽ xem trang web trên là một trang HTML với hyperlink thông thường. Nếu user truy cập với browser đã bật JS thì nội dung sẽ được load bằng kĩ thuật AJAX. Thế có phải là vừa đảm bảo tính userbility và vừa đảo bảo SEO không.
Cho em hỏi đây có phải là blackhat SEO ko ! Dẫn con Bot vô 1 trang và User vô 1 trang khác ! Em chưa biết gì nên hỏi tạm đây
khonggiannet viết 13:12 ngày 10/10/2018
Không, Bot và User đều xem một trang HTML như nhau mà. Điểm khác là user dùng browser với javascript được kích hoạt nên sử dụng được tính năng AJAX để load nội dung động. Cách trên cũng được Google khuyến cáo để tăng tính userbility cho website. (User có thể truy cập được ngay cả khi browser không hỗ trợ javascript).
lenggiauit viết 13:17 ngày 10/10/2018
Topic chống lại cả Google Lở scriptRequest là kiểm tra Login thì sao nhỉ ?
thuyduongcd viết 13:25 ngày 10/10/2018
những con bọ ngu ngốc mà Google thả vô
Vậy, Với một cái đầu "thông minh" như bạn, bạn có thể tạo ra những cái ngu ngốc đó không?
Chẳng hiểu sao facebook đạt Google PR10
Xin lỗi, tôi chỉ đưa ý kiến, không phải để đả kích lẫn nhau nên tôi xin không bàn luận với bạn.

Làm gì mà chênh nhau giữa vài phút với 1 giây - có bốc phét quá không bạn?
Cũng chưa hẳn là không có nếu có sự chênh lệch lớn giữa nội dung của 2 kiểu Request, một request chỉ một vài dòng nội dung và một request đến cả trang web. Đặc biệt nếu máy client hơi yếu. Còn đoạn code bạn đưa thấy cũng chẳng có chút gì gọi là SEO cả.
Không, Bot và User đều xem một trang HTML như nhau mà
Không giống nhau. Ví dụ có 2 URL:
Code:
http://abc.com/index.php?id=1
http://abc.com/index.php?id=2
Với user thì đó là 2 trang khác nhau nhưng với GB thì rất dễ dàng bị đánh đồng với nhau.

Topic chống lại cả Google Lở scriptRequest là kiểm tra Login thì sao nhỉ ?
kiểm tra login thì ai cũng mã hóa data hết rồi, có gì mà phải ngại.
Bài liên quan
0