NHANWEB

Chuyện về cha đẻ của mã Captcha

Mỗi ngày, có khi bạn phải nhập đến hàng chục mã Captcha để xác định mình chính là người dùng bình thường mà không phải một chương trình tự động được xây dựng trên máy tính. Ẩn đằng sau mã Captcha đó là câu chuyện về cha đẻ của nó – Luis Von Ahn mà có thể nhiều người chưa được biết đến.

Năm 1990, thế giới web bắt đầu sinh sôi nảy nở, kéo theo nó là hiện tượng spam khi ngày càng nhiều chương trình giả lập trên máy tính cố gắng làm thay các công việc của con người và tạo ra một lượng nội dung rác trên internet vào lúc đó. Năm 2000, cậu sinh viên Luis Von Ahn cảm thấy bức bối vì số lượng thông tin rác ngày càng lớn và anh sáng tạo ra cái gọi là CAPTCHA nhằm phân biệt giữa người và chương trình giả lập máy tính. Và mã CAPTCHA hay là chữ viết tắt của của “Completely Automated Public Turing test to tell Computers and Humans Apart” (Phép thử Turing công cộng hoàn toàn tự động để phân biệt máy tính với người) đã ra đời như vậy.

Luis Von Ahn

Ý tưởng của Luis Von Ahn là tạo ra một chương trình mà máy chủ sẽ yêu cầu một người dùng hoàn tất một kiểm tra đơn giản mà máy tính có thể tạo ra và có thể đánh giá nhưng không thể tự giải được. Và khi máy tính không thể tự giải được bài toán do mình đặt ra, bất kỳ người dùng nào nhập và trả lời đúng đáp án đều được xem là con người.

Mã Captcha

Chỉ một năm sau, ý tưởng nà được sử dụng rộng rãi và người dùng đã nhập hàng triệu mã Captcha mỗi ngày khi Yahoo! chính thức sử dụng nó như một công cụ kiểm tra để phân biệt giữa người và máy.

Thành công này của mã Captcha đã đưa chàng sinh viên Ahn lên một tầm cao mới và anh được giữ lại trường đại học Carnegie Mellon để giảng dạy ngay sau khi nhận được bằng tiến sĩ, đồng thời anh cũng rinh luôn giải thưởng danh giá MacArthur Fellowship năm 2006 cùng nửa triệu đô la tiền thưởng.

ReCaptcha

Khi mã Captcha đã trở nên phổ biến, Luis Von Ahn nhận ra rằng con người đang phí hàng rất nhiều thời gian để chứng minh bản thân mình là con người trước máy tính bằng cách nhập những dãy ký tự vô hồn vào máy tính. Ông bắt đầu suy nghĩ cách tận dụng khoản thời gian này vào những việc có ích hơn và mã ReCaptcha ra đời.

Mã ReCaptcha

Về căn bản, ReCaptcha cũng giống như Captcha: chúng dùng để xác định người giải bài toán do máy tính đưa ra có phải là con người hay không nhưng về hiệu quả có đôi chút thay đổi. Mã ReCaptcha được tạo ra bằng 2 từ: một từ bằng cách nào đó giúp xác định người dùng có phải là con người hay không, từ còn lại là một từ ngữ mà máy tính chưa thể hiểu được trong các văn bản được số hóa. Qua đó, bằng việc nhập mã ReCaptcha, con người ngoài việc xác định “thân phận” của mình còn giúp máy tính hiểu đúng từ mà nó chưa thể hiểu được trong quá trình số hóa dữ liệu văn bản và có thể chỉ mục được nội dung. Việc này làm cho các luận văn, các tác phẩm văn chương, các công trình khoa học được máy tính hiểu một cách rõ ràng hơn, cụ thể hơn và chỉ mục dữ liệu tốt hơn.

Người ta ước tính, ngày có khoản 200 triệu mã ReCaptcha được gõ trên toàn thế giới mỗi ngày, thời gian để gõ một mã ReCaptcha trung bình là 10 giây nhân với số lượng mã này, dựa trên mức lương trung bình ở Mỹ là khoảng 7 đô la/giờ, mỗi ngày mã ReCaptcha tiết kiệm cho thế giới khoảng 4 triệu đô la tiền thuê nhân viên nhập liệu và kiểm tra những từ ngữ mà máy tính chưa thể hiểu được. Con số này nếu tính theo năm sẽ là tiết kiệm được hơn 1 tỉ đô la mỗi năm.

Sự thành công và tác dụng to lớn của ReCaptcha đã khiến cho Google quyết định mua nó từ Luis Von Ahn vào năm 2007 và cung cấp lại nó miễn phí cho nhiều người dùng khác. Việc này đem lại nhiều cái lợi cho cỗ máy tìm kiếm khổng lồ Google: vừa cung cấp cho người dùng một công cụ miễn phí, vừa có thể giúp máy tính hiểu được một số từ ngữ trong văn bản và có thể đánh chỉ mục chúng dễ dàng hơn, giúp cho công cụ tìm kiếm của Google thông minh hơn. Nếu như bạn thường xuyên sử dụng website, bạn sẽ nhận ra hiện tại Google còn sử dụng mã ReCaptcha cho hình ảnh, biết đâu đây là cách Google muốn người định nghĩa những bức ảnh mà máy tính của họ tạm thời không thể hiểu được.

Mã Captcha, ReCaptcha hiện nay được sử dụng trong rất nhiều dịch vụ xương sống của Internet nhưu FaceBook, Twitter, Yahoo!, Google….

Exit mobile version