Google Analytics – một công cụ thống kê website được nhiều webmaster sử dụng ẩn chứa một số vấn đề liên quan đến giải thuật tính toán mà không phải ai cũng đủ khả năng để nhận ra. Vấn đề mà tôi muốn nói đến ở bài viết này chính là số liệu Time On Site và Bounce Rate của website có thể không chính xác.
Để bạn đọc hiểu rõ hơn về vấn đề này, chúng ta hãy cùng xem xét 2 trường hợp dưới đây:
Phụ mục
Trường hợp cực xấu
Anh Tèo(một người dùng bình thường của bạn) lên mạng và truy cập vào website bạn, anh ta ngồi đọc một bài đầu tiên mà anh nhận được trong 2 phút 14 giây. Sau đó, vì có việc bận, anh lưu trang web của bạn vào bookmark, tắt trình duyệt và đi làm việc khác.
Bạn đã nhận ra vấn đề hay chưa ?
Rõ ràng, Tèo không hề tương tác với website, anh đơn giản chỉ mở, đọc và tắt ngay ở trang đầu tiên. Với Google, đây rõ ràng là một “bounce“. Và với một truy cập được cho là không tương tác gì với website, Google sẽ đánh dấu Time On Site là 0:00 bởi dữ liệu chỉ được cập nhật ở lần tương tác tiếp theo với đoạn script của Google Analytics. Nói một cách dễ hiểu, Google Analytics xác định thời điểm bạn ở trên 1 trang web bắt đầu từ lúc nó được tải lên lần đầu tiên, khi bạn tương tác (chuyển trang chẳng hạn) dữ liệu này sẽ được cập nhật lại. Và một khi đã rơi vào bounce, nghĩa là nó không hề được cập nhật lại, thời gian thực tế bạn ở trên trang lúc này sẽ được Google tính là 0:00.
Quá đau đớn…
Trường hợp xấu thứ 2
Bây giờ chúng ta thử tìm hiểu thêm một trường hợp khác cũng “đen” không kém. Anh Tí( em trai cùng cha khác … ông ngoại của anh Tèo chẳng hạn) cũng truy cập vào website bạn. Tí cũng tốn hết 2:14 giây để đọc bài đầu tiên, sau đó anh ta chuyển sang một trang mới và … tắt đi. Nghĩa là anh ta có một tương tác với website trước khi rời khỏi trang web của bạn.
Trường hợp này có vẻ sáng sủa hơn so với trường hợp của anh Tèo ở trên bởi anh Tí rõ ràng có tương tác với website và dữ liệu về Time On Site được cập nhật, Bounce Rate dĩ nhiên cũng không “dính”.
Bây giờ chúng ta tiến hành phân tích kĩ hơn hành động của Tí:
– Tí rõ ràng đã truy cập 2 webpage với tổng thời gian là 2:14, như vậy thời gian trung bình trên một trang của anh sẽ là 1:12 chứ không phải thời gian thực tế 2:14. Google tính Time On Site và Bounce Rate dựa vào căn cứ là đơn vị PageView, nên với 2:14 giây anh Tí đã tiêu tốn là cho 2 PageView chứ không phải là 1 PageView trên thực tế. Và bạn cũng thấy đó, trị số PageView gần như quyết định rất nhiều, làm ảnh hưởng đến chất lượng của Time On Site và Bounce Rate như thế nào. Và gần như Time On Site có tác động rất ít để có thể thay đổi Bounce Rate và PageView. Điều này đã được nói rõ trong bài viết “The percentage of people who come to your website and leave instantly” – tác giả Avinash Kaushik.
Giải quyết nó như thế nào ?
Thật may mắn là chúng ta vẫn có một vài giải pháp để kiểu soát tình hình, trong đó giải pháp khả thi nhất vẫn là sử dụng những công cụ của Google để cập nhật liên tục những giá trị cần thiết lên Google Analytics. Công cụ mà tôi muốn nói đến đó là Event Tracking API. Với công cụ này, bạn có thể thông báo với Google Analytics rằng 2 anh chàng Tí và Tèo vẫn đang ở trên website của bạn sau mỗi 10 giây, bằng cách này Google Analytics sẽ nhận được những số liệu chính xác hơn ngay ở trang đầu tiên. Kết quả là bạn sẽ có một số liệu toàn cảnh chính xác hơn về người dùng trên Google Analytics.
Javascript
Bạn copy và paste đoạn mã javascript sau vào trước thẻ </body> trên trang web của mình:
[code language=”javascript”] (function (tos) {window.setInterval(function () {
tos = (function (t) {
return t[0] == 50 ? (parseInt(t[1]) + 1) + ‘:00’ : (t[1] || ‘0’) + ‘:’ + (parseInt(t[0]) + 10);
})(tos.split(‘:’).reverse());
window.pageTracker ? pageTracker._trackEvent(‘Time’, ‘Log’, tos) : _gaq.push([‘_trackEvent’, ‘Time’, ‘Log’, tos]);
}, 10000);
})(’00’);
[/code]
Một khi đã được cài đặt đoạn code này, trang web của bạn sẽ được kết nối và ghi kết quả vào Google Analytics sau mỗi 10 giây/lần. Các số liệu về thời gian sẽ được cập nhật liên tục dạng: 0:10, 0:20, 0:30, 0:40, 0:50, 1:00, 1:10….
Mặc dù Google Analytics có sai sót của nó, nhưng bên cạnh nó là một hệ thống mở rộng (API) mạnh mẽ giúp bạn can thiệp dễ dàng và nhanh chóng. Trong giới hạn kiến thức của mình, bạn có thể tận dụng được càng nhiều API, khả năng kiểm soát tình huống của bạn càng cao.