RobotVN 1.2.0 open beta…

Sau hơn 2 tuần code mệt nghỉ cuối cùng thành quả cũng có rồi. Hiện nay, mình đang chạy thử nghiệm RobotVN 1.2.0 tại địa chỉ website azwebtip.com.

Có gì mới ?

Các phiên bản vừa qua nhận được khá nhiều lời khen chê từ phía cộng đồng cũng như những anh em thân quen mà mình có dịp hỗ trợ. Phải nói rằng những lời góp ý của mọi người đã giúp ích rất nhiều cho phiên bản 1.2.0 này. Mặc dù chưa ra mắt chính thức và còn đang trong giai đoạn chạy thử nghiệm nhưng mình tin rằng RobotVN 1.2.0 sẽ làm hài lòng người sử dụng không ở khía cạnh này thì cũng ở khía cạnh khác. Điểm qua một số thay đổi chính nhé:

Về cấu trúc hệ thống

– Database được tối ưu hóa và tổ chức dữ liệu lại với sự xuất hiện của một số table mới được tách ra từ table wp_robotvn để đáp ứng một số giải thuật được xây dựng trên mã nguồn cũng như thực hiện một số tính năng mới mang tính tối ưu hệ thống.
– Hệ thống robot lấy tin được xây dựng linh động hơn. Có thể dễ dàng cập nhật danh sách robot đang hoạt động chỉ bằng 1 thao tác đơn giản: copy file xử lý dữ liệu của robot vào thư mục thích hợp. Hệ thống sẽ tự nhận diện và tự động đưa robot vào hoạt động cùng với các robot khác.
– Tính năng tối ưu hóa SEO được tính đến bằng việc chỉnh sửa các đường dẫn ảnh nếu bạn upload hình ảnh về host của mình. Trong trường hợp đó, tên ảnh sẽ được xây dựng dựa theo tên bài viết. Ngoài ra những tính năng mới cũng hỗ trợ SEO khá nhiều mình sẽ nói đến ở phần sau.

Các tính năng mới bổ sung

Qua góp ý của nhiều người sử dụng khác nhau, mình đã bổ sung thêm 1 số tính năng mở rộng của hệ thống như:

Tính năng lấy bài viết bằng proxy: tính năng này cho phép bạn lấy tin bằng proxy thay vì IP của máy chủ đang chạy website. Điều này giúp bạn vượt qua “bức tường lửa” của hệ thống máy chủ nguồn khi họ chặn hệ thống lấy tin của bạn. Tuy nhiên, mình vẫn đang xem xét khả năng sử dụng hiệu quả của tính năng này do hầu hết các proxy có tuổi đời không lâu nên việc active proxy sẽ khiến cho đôi lúc việc lấy bài gặp khó khăn do proxy không còn hoạt động.
RSS Poster: sẽ giúp bạn lấy bài viết theo RSS của nguồn. Thay vì đòi hỏi bạn cung cấp một RSS full để có thể lấy bài, RobotVN phiên bản 1.2.0 không yêu cầu điều đó. Nó làm việc dựa trên cơ chế lấy RSS bình thường và dựa trên cơ chế bóc tin của các phiên bản trước để lấy nội dung cụ thể của từng bài. Điểm hạn chế của tính năng này là các nguồn không có trong danh sách các Robot sẽ không thể lấy được nội dung đầy đủ. Tuy nhiên, thay vì sử dụng keyword để lấy tin theo bài viết, tính năng này sẽ giúp bạn “nguồn có tin gì thì bạn có tin đó”.

Tính năng thay đổi từ khóa: đây là một thay đổi nhỏ giúp bạn tạo thư việc từ thay thế và thay thế các từ ngữ trong bài bằng các từ ngữ bạn định nghĩa. Nó giúp hỗ trợ tạo ra unique content dễ dàng hơn và đưa một số từ khóa mục tiêu vào bài viết để bài viết của bạn được SEO tốt hơn.

Tính năng tự chèn liên kết: đi song song với việc format bài viết. Hệ thống sẽ tự động chèn các liên kết mục tiêu vào các từ khóa với liên kết do bạn xác lập. Điều này có ý nghĩa nhất định trong việc tạo innerlink và backlink về một website khác nếu bạn cần. Ngoài mục đích như đã nói ở trên, bạn sẽ có tỉ lệ Page per visitTime on site tốt hơn. Tuy nhiên, trong phiên bản này mình giới hạn 1 liên kết cho 1 từ khóa ở mỗi bài để tránh tình trạng bị Google xác định là farm link.

Tính năng lựa chọn tác giả đăng tin: tính năng này mình mới đưa vào sau này nhằm tạo ra sự sinh động cho website. Bạn sẽ có nhiều “biên tập viên” ảo trên website và chỉ việc lựa chọn biên tập viên nào sẽ làm việc mà thôi.

Điểm qua vài tính năng mới của RobotVN là như thế :)

Đánh giá của bạn

Mình có tạo một Poll để các bạn đánh giá dễ dàng đây:

RobotVN


Dĩ nhiên, một con robot tự động không thể nào làm thay thế một công việc giống như 1 con người nên các bạn cũng đừng trông đợi gì nhiều quá :D. Mục đích con robot này được mình xác định ngay từ đầu là thay thế một phần công việc nào đó của con người chứ không phải tất cả. Mọi nhận xét và góp ý khác các bạn vui lòng comment nhé !

About Nguyễn Duy Nhân

Một blogger ... cùi bắp! Đơn giản: tôi muốn ghi lại những gì xảy ra xung quanh, cả công việc lẫn cuộc sống và chia sẻ với các bạn đọc. Nếu bạn cảm thấy bài viết có nhiều điểm không chính xác, hãy comment và chia sẻ để tôi còn được học hỏi từ những góp ý của bạn.

Comments

  1. Hiện tại qua chạy thử nghiệm trên host thực tế mình gặp 1 số vấn đề nho nhỏ với phiên bản WP 3.2 mới được nâng cấp. Tiếp tục fix =))

  2. Ở phiên bản 1.1.0 mỗi lần robot lấy tin , dường như hệ thống bị quá tải, làm việc hiển thị web rất chậm.

    • Việc lấy tin bao gồm xử lý dữ liệu nhiều lần như tìm kiếm từ khóa, bóc tách nội dung… nên dĩ nhiên máy chủ phải làm việc nhiều hơn bình thường. Do đó, bạn nên sắp xếp thời gian hợp lý (ví dụ như việc bóc tách tin nên xử lý vào ban đêm chẳng hạn) và hạn chế số lượng robot chạy đồng thời phù hợp với tình trang host của bạn.

      Ngoài ra, ở phiên bản trước trong quá trình lấy tin có gặp 1 lỗi liên quan đến vòng lặp khiến cho tiêu tốn 1 lượng resource nhiều hơn bình thường. Lỗi này đã được phát hiện 1 cách tình cờ và fix ở phiên bản 1.2.0

  3. Hi, tìm kiếm thông tin về robotvn kéo em đến trang này, bác cho em hỏi là bản 1.2 bao giờ bác làm xong, làm xong thì thương mại hay free. Đặt gạch chờ bản chính thức của bác

  4. Mà đợt này http://vnwebmaster.com/ bị gì mà vào toàn bị trả về lỗi 404.

  5. Blog Cơ Khí says:

    Cung hỉ, cung hỉ bác, chúc “đứa con” này của bác khỏe mạnh để anh em được nhờ >:D<

  6. Minh Tuan says:

    download o dau the ?

  7. Nguyen Anh says:

    Em chưa được sử dụng phiên bản này
    nhưng phiên bản 1.1 hiện bị lỗi duplicate bài (khi server lag)
    hi vọng a khắc phục được lỗi này

    • Mình tìm được lỗi duplicated của Tuổi Trẻ do báo này sử dụng cơ chế redirect page (link lúc đầu khác link chứa nội dung). Vẫn đang loay hoay tìm 1 giải pháp thỏa đáng cho nó =P~

      • Nguyen Anh says:

        Ko riêng báo tuoitre đâu anh ạ
        em đang chạy thì gần như báo nào cũng bị Duplicate hết
        Có khi 1 bài trùng đến 5-7 lần
        Thường thì lúc server không lag thì ko sao
        nhưng mỗi lần Server bị lag thì trùng bài 100% xảy ra

        Cũng có thể là vì lag mà bot quét qua link đó mấy lần (vì tưởng chưa quét)
        nên có thể khắc phục bằng cách đánh dấu link đã quét rồi

  8. Tui ủng hộ bác làm cái Robot VN này đấy. Chúc bác thành công…

    À. Mà bác đừng share. Bán đi. Tui sẵn sàng mua!

    Nguyễn Lê Quý Phát Director!!!

    :) :) :)

  9. Robot VN? It sounds like just post wp-automatic robot?

    if it really good? $ 105. I can buy?

  10. Nếu bác bán với giá khoảng 200 VND thì có lẽ em có điều kiện mua đấy…
    =)) =)) =))

  11. Robot VN? It sounds like just post wp-robot?

    if it really good? $ 105. I can buy?

  12. Lỗi duplicate của nó hao tốn ổ cứng kinh khủng, hi vọng bản mới bác sớm khắc phục vấn đề này.
    Chúc blog của bác ngày càng lớn mạnh. Thanks you so much!

  13. Chừng nào xong thế Nhân, đợi quá lâu.

    • Híc ! Đang phải ngừng tất cả để tập trung hội thảo SEO Idol 2011 ngày mai bác ah. Sau hội thảo mới tính tiếp được vì mình là phó BTC nên ko bỏ được rồi.

  14. Girl Baby Xinh says:

    Kể ra Lão Nhân này cũng giỏi phết ấy nhỉ???
    Chúc mau chóng làm ra Robotvn mới nhé…!

    ;):x ;):x ;):x

  15. Gia Nong San says:

    theo e gia cua plugin nay tam 120k den 200k la phu hop :D

  16. Các bác có ai biết cái plugin này tên gi ko vậy?
    Ảnh dưới nè gì tìm hoai ma ko ra:
    http://tC2.upanh.com/thumbpic/26.853.34078601.sU50/tag.120×1.jpg

  17. Ohmylove Cnet says:

    Mong bác làm xong rồi cho em xài với nhé!!!

    Cố gắng lên nhé!

    :) :) :)

  18. nguyenvanba says:

    hi bác,
    con robotvn của bác seo rồi, minh đang chờ đợi để thử nó, không biết bác đã fix xong chưa? :P

  19. BaoNongSan.Com says:

    thang 9 rui ! hom nay la mung 9/9 rui ma ko thay bac Nhan nha ta cho ban beta nhi

  20. lâu wa’ bác Nhân ơi !! E chờ dài cả…….râu rùi nà :D

  21. Nếu robot này hỗ trợ vietnamnet.vn thì tuyệt vời quá bác ơi =D>

  22. Mình đang chờ phiên bản này. Hy vọng bác ra sớm :)

  23. Mong chờ quá :kill:

  24. Bac nhan som hoan thanh cho ae xai ké hoặc bán cũng ok >:D<

  25. Anonymous says:

    Nên share cho mọi người học tập đi. Vì thương mại cũng chẳng được mấy người, người cần thiết thì không có được vì không có điều kiện, vậy thì làm và quảng cáo để làm gì chứ

  26. Anh Nhân share cho anh em đi, em đang cần nó, có gì thì quyên góp ủng hộ chứ đừng làm thương mại :((

  27. Nếu được bác có thể vui lòng share cho mình xin 1 bản được không >:D<

  28. Nguyễn Trung says:

    bác Nhân ơi cho em hỏi chút! cái send mail ở phiên bản nhận web trước bác dùng plugin j vậy? thank bác nhiều >:D<

  29. Anh à, anh cứ thương mại đi! Giá khoảng 400–900 ngàn gì đó! Chia ra nhiều bản như :
    Lite
    Professional
    Enterprise…………..
    Gì đó là tùy! Nhưng nhớ Security chút, đừng để bị Crack! và làm nhanh lên!

    Lâu thế này. Lòng tin mọi người sẽ giảm nhiều lắm đó! =)) =)) =))

  30. Chắc khoảng cuối tháng này có hàng cho mọi người, hiện nay NhanWeb chậm cập nhật cũng vì lý do này.

  31. Chúc anh thành công! :) :) :)

  32. Nguyen Lac says:

    Có hàng chưa bác Nhân ơi, sao lâu thế bác, có trục trặc gì ah?

  33. Tên vi phạm says:

    Dự án này của bác thế nào rồi ạ?

  34. Bác nhân làm con Robot xong chưa share giúp mình với, mình đang cần nó…
    phuongng30690@gmail.com

  35. Mong chờ bác nhân share con robot này cho mọi người.

  36. Warning: file_get_contents(http://search.vnexpress.net/news?s=sim+s%E1%BB%91) [function.file-get-contents]: failed to open stream: HTTP request failed! HTTP/1.1 400 Bad Request in C:\AppServ\www\wordpress\wp-content\plugins\robotvn\simplehtmldom\simple_html_dom.php on line 39

    Warning: file_get_contents() [function.file-get-contents]: php_network_getaddresses: getaddrinfo failed: No such host is known. in C:\AppServ\www\wordpress\wp-content\plugins\robotvn\simplehtmldom\simple_html_dom.php on line 39

    Warning: file_get_contents(http://thethaovanhoa.vnhttp://thethaovanhoa.vn/xa-hoi/cuop-sim-so-dep-n20110726101224006.htm) [function.file-get-contents]: failed to open stream: php_network_getaddresses: getaddrinfo failed: No such host is known. in C:\AppServ\www\wordpress\wp-content\plugins\robotvn\simplehtmldom\simple_html_dom.php on line 39

    Fatal error: Call to a member function find() on a non-object in C:\AppServ\www\wordpress\wp-content\plugins\robotvn\robot.php on line 254
    Chẳng biết bị sao nữa. Mình đang chạy trên localhost

  37. TuNguyen Design says:

    Bác Nhân ơi…cho mình hỏi Bác tí về cái Plugin RobotVN
    Mình đang chạy demo wordpress 3.5.1…. không biết Plugin này có hỗ trợ cho wp 3.5.1 ko vậy Bác…. với lại mình đang chay tren localhost thi co ok ko Bác

    Thanks Bác!

  38. Warning: file_get_contents(): Couldn’t resolve host name in /home/u166499995/public_html/wp-content/plugins/robotvn/simplehtmldom/simple_html_dom.php on line 39 Warning: file_get_contents(http://thethaovanhoa.vnhttp://thethaovanhoa.vn/bong-da-anh/chelsea-hop-bao-cong-bo-tan-hlv-mourinho-khong-con-dac-biet-n20130610212202814.htm): failed to open stream: operation failed in /home/u166499995/public_html/wp-content/plugins/robotvn/simplehtmldom/simple_html_dom.php on line 39 Fatal error: Call to a member function find() on a non-object in /home/u166499995/public_html/wp-content/plugins/robotvn/robot.php on line 254
    bản 1.1.0 bấm đăng tin ngay thì lỗi thế này

  39. Tên vi phạm says:

    Mong anh share cho mọi người đi. Còn trả phí thì 100k/tháng thui. :D

  40. Em thích Plugin này rồi bác ạ! :D

  41. :D Plugin ngon, em xin bản Free về làm site news đây =D

Speak Your Mind

*

:D :) >:D< :P :(( :beat: ;):x L-) ;)) :shot: =)) :kill: >:) =P~ more »