10/10/2018, 11:09
Google bot - những con bọ làm cản bước tiến công nghệ web
Từ trước tới nay, những người lập trình web luôn cải tiến kỹ thuật nhằm thu hẹp tối đa khoảng cách giữa Web Application (WA) và Desktop Application (DA), tạo cho người duyệt web một cảm giác không còn rào cản về thời gian, giống như đang thao tác trên một Desktop Appplication thực thụ.
Và trong nỗ lực không ngừng, Jesse James Garrett đã đưa ra một kỹ thuật mang tính đột phá, đó chính là kỹ thuật ajax. Với kỹ thuật này, việc truyền dữ liệu giữa client và server không còn là vấn đề, và mang lại cảm giác "as soon as click".
Việc áp dụng kỹ thuật này kết hợp với thuật toán đoán trước những gì sẽ xảy ra tiếp theo những tưởng sẽ đạt kết quả khả quan cho mơ ước xóa bỏ rào cản giữa WA và DA (Tôi đã từng áp dụng và cũng đạt kết quả mỹ mãn)
Thế mà đùng một cái, người ta phát hiện ra rằng những con bọ ngu ngốc mà Google thả vô (Google Bot) chỉ quan tâm nhiều đến httprequest mà bỏ qua scriptRequest. Kết quả là người ta chỉ quan tâm tới việc làm thế nào để tạo ra những url thật "thân thiện với SEO" mà không hề quan tâm chút gì đến những thao tác trên web. Thay vì hạn chế tối đa request đến server (nhằm giảm tải cho server và giảm thời gian chờ cho user) thì người ta lại đi làm ngược lại, tăng cường tối đa httprequest để đánh lừa Google Bot. Hậu quả là người dùng phải chờ đến vài phút chỉ để browser thay đổi vài dòng nội dung. (Mà lẽ ra chỉ cần chưa tới 1 giây)
Và chắc mọi người cũng dễ dàng nhận ra phong trào "nhà nhà cùng SEO, người người cùng SEO". Nếu cứ như thế này thì không biết Web Appplication sẽ đi về đâu?
Và trong nỗ lực không ngừng, Jesse James Garrett đã đưa ra một kỹ thuật mang tính đột phá, đó chính là kỹ thuật ajax. Với kỹ thuật này, việc truyền dữ liệu giữa client và server không còn là vấn đề, và mang lại cảm giác "as soon as click".
Việc áp dụng kỹ thuật này kết hợp với thuật toán đoán trước những gì sẽ xảy ra tiếp theo những tưởng sẽ đạt kết quả khả quan cho mơ ước xóa bỏ rào cản giữa WA và DA (Tôi đã từng áp dụng và cũng đạt kết quả mỹ mãn)
Thế mà đùng một cái, người ta phát hiện ra rằng những con bọ ngu ngốc mà Google thả vô (Google Bot) chỉ quan tâm nhiều đến httprequest mà bỏ qua scriptRequest. Kết quả là người ta chỉ quan tâm tới việc làm thế nào để tạo ra những url thật "thân thiện với SEO" mà không hề quan tâm chút gì đến những thao tác trên web. Thay vì hạn chế tối đa request đến server (nhằm giảm tải cho server và giảm thời gian chờ cho user) thì người ta lại đi làm ngược lại, tăng cường tối đa httprequest để đánh lừa Google Bot. Hậu quả là người dùng phải chờ đến vài phút chỉ để browser thay đổi vài dòng nội dung. (Mà lẽ ra chỉ cần chưa tới 1 giây)
Và chắc mọi người cũng dễ dàng nhận ra phong trào "nhà nhà cùng SEO, người người cùng SEO". Nếu cứ như thế này thì không biết Web Appplication sẽ đi về đâu?
Bài liên quan
Còn chuyện tại sao em google bot vẫn chưa hiểu đc script Request thì đơn giản vì nó quá phức tạp, để hiểu đc các truy vấn của script đòi hỏi khả năng đọc hiểu cách viết của script, trong khi 1 số script viết quá phức tạp. Nếu 1 con bot có khả năng đọc hiểu toàn bộ các viết script của loài người thì con bot đó phải nặng bao nhiêu ? 1GB hay 10GB , nếu 1 ngày chừng 10 con như thế vào thì những site vừa và nhỏ sẽ chịu không nổi? Google sẽ không điên như thế. Mặt khác các nhà phát triển web thông minh sẽ lợi dụng luôn cả 2 giao thức request, bên phần end-user font họ vẫn sài ajax nhưng mặt khác vẫn tạo httprequest để các chú bot có thể hiểu.
Chẳng hiểu có phải bạn học quá nhiều nên mới suy nghĩ thiếu logic như vậy không hoặc có lẽ bạn sẽ là thiên tài khi viết ra 1 con bot hiểu script chỉ năng 1kb
những con bọ ngu ngốc mà Google thả vô
Vậy, Với một cái đầu "thông minh" như bạn, bạn có thể tạo ra những cái ngu ngốc đó không?
Chẳng hiểu sao facebook đạt Google PR10
Nếu như bạn cho rằng dùng AJAX làm cho Google Bot không index được thì đó là vì bạn không biết cách dùng AJAX. Hãy xem ví dụ sau của tôi nhé:
Vậy, Với một cái đầu "thông minh" như bạn, bạn có thể tạo ra những cái ngu ngốc đó không?
Chẳng hiểu sao facebook đạt Google PR10