Sau hơn 2 tuần code mệt nghỉ cuối cùng thành quả cũng có rồi. Hiện nay, mình đang chạy thử nghiệm RobotVN 1.2.0 tại địa chỉ website azwebtip.com.
Phụ mục
Có gì mới ?
Các phiên bản vừa qua nhận được khá nhiều lời khen chê từ phía cộng đồng cũng như những anh em thân quen mà mình có dịp hỗ trợ. Phải nói rằng những lời góp ý của mọi người đã giúp ích rất nhiều cho phiên bản 1.2.0 này. Mặc dù chưa ra mắt chính thức và còn đang trong giai đoạn chạy thử nghiệm nhưng mình tin rằng RobotVN 1.2.0 sẽ làm hài lòng người sử dụng không ở khía cạnh này thì cũng ở khía cạnh khác. Điểm qua một số thay đổi chính nhé:
Về cấu trúc hệ thống
– Database được tối ưu hóa và tổ chức dữ liệu lại với sự xuất hiện của một số table mới được tách ra từ table wp_robotvn để đáp ứng một số giải thuật được xây dựng trên mã nguồn cũng như thực hiện một số tính năng mới mang tính tối ưu hệ thống.
– Hệ thống robot lấy tin được xây dựng linh động hơn. Có thể dễ dàng cập nhật danh sách robot đang hoạt động chỉ bằng 1 thao tác đơn giản: copy file xử lý dữ liệu của robot vào thư mục thích hợp. Hệ thống sẽ tự nhận diện và tự động đưa robot vào hoạt động cùng với các robot khác.
– Tính năng tối ưu hóa SEO được tính đến bằng việc chỉnh sửa các đường dẫn ảnh nếu bạn upload hình ảnh về host của mình. Trong trường hợp đó, tên ảnh sẽ được xây dựng dựa theo tên bài viết. Ngoài ra những tính năng mới cũng hỗ trợ SEO khá nhiều mình sẽ nói đến ở phần sau.
Các tính năng mới bổ sung
Qua góp ý của nhiều người sử dụng khác nhau, mình đã bổ sung thêm 1 số tính năng mở rộng của hệ thống như:
– Tính năng lấy bài viết bằng proxy: tính năng này cho phép bạn lấy tin bằng proxy thay vì IP của máy chủ đang chạy website. Điều này giúp bạn vượt qua “bức tường lửa” của hệ thống máy chủ nguồn khi họ chặn hệ thống lấy tin của bạn. Tuy nhiên, mình vẫn đang xem xét khả năng sử dụng hiệu quả của tính năng này do hầu hết các proxy có tuổi đời không lâu nên việc active proxy sẽ khiến cho đôi lúc việc lấy bài gặp khó khăn do proxy không còn hoạt động.
– RSS Poster: sẽ giúp bạn lấy bài viết theo RSS của nguồn. Thay vì đòi hỏi bạn cung cấp một RSS full để có thể lấy bài, RobotVN phiên bản 1.2.0 không yêu cầu điều đó. Nó làm việc dựa trên cơ chế lấy RSS bình thường và dựa trên cơ chế bóc tin của các phiên bản trước để lấy nội dung cụ thể của từng bài. Điểm hạn chế của tính năng này là các nguồn không có trong danh sách các Robot sẽ không thể lấy được nội dung đầy đủ. Tuy nhiên, thay vì sử dụng keyword để lấy tin theo bài viết, tính năng này sẽ giúp bạn “nguồn có tin gì thì bạn có tin đó”.
– Tính năng thay đổi từ khóa: đây là một thay đổi nhỏ giúp bạn tạo thư việc từ thay thế và thay thế các từ ngữ trong bài bằng các từ ngữ bạn định nghĩa. Nó giúp hỗ trợ tạo ra unique content dễ dàng hơn và đưa một số từ khóa mục tiêu vào bài viết để bài viết của bạn được SEO tốt hơn.
– Tính năng tự chèn liên kết: đi song song với việc format bài viết. Hệ thống sẽ tự động chèn các liên kết mục tiêu vào các từ khóa với liên kết do bạn xác lập. Điều này có ý nghĩa nhất định trong việc tạo innerlink và backlink về một website khác nếu bạn cần. Ngoài mục đích như đã nói ở trên, bạn sẽ có tỉ lệ Page per visit và Time on site tốt hơn. Tuy nhiên, trong phiên bản này mình giới hạn 1 liên kết cho 1 từ khóa ở mỗi bài để tránh tình trạng bị Google xác định là farm link.
– Tính năng lựa chọn tác giả đăng tin: tính năng này mình mới đưa vào sau này nhằm tạo ra sự sinh động cho website. Bạn sẽ có nhiều “biên tập viên” ảo trên website và chỉ việc lựa chọn biên tập viên nào sẽ làm việc mà thôi.
Điểm qua vài tính năng mới của RobotVN là như thế :)
Đánh giá của bạn
Mình có tạo một Poll để các bạn đánh giá dễ dàng đây:
Dĩ nhiên, một con robot tự động không thể nào làm thay thế một công việc giống như 1 con người nên các bạn cũng đừng trông đợi gì nhiều quá :D. Mục đích con robot này được mình xác định ngay từ đầu là thay thế một phần công việc nào đó của con người chứ không phải tất cả. Mọi nhận xét và góp ý khác các bạn vui lòng comment nhé !
Nguyễn Duy Nhân says
Hiện tại qua chạy thử nghiệm trên host thực tế mình gặp 1 số vấn đề nho nhỏ với phiên bản WP 3.2 mới được nâng cấp. Tiếp tục fix =))
newbie says
Bác ơi, con robot xong chưa bác, cho anh em thưởng thức nũa chứ…
=))
HHIT says
Ở phiên bản 1.1.0 mỗi lần robot lấy tin , dường như hệ thống bị quá tải, làm việc hiển thị web rất chậm.
Nguyễn Duy Nhân says
Việc lấy tin bao gồm xử lý dữ liệu nhiều lần như tìm kiếm từ khóa, bóc tách nội dung… nên dĩ nhiên máy chủ phải làm việc nhiều hơn bình thường. Do đó, bạn nên sắp xếp thời gian hợp lý (ví dụ như việc bóc tách tin nên xử lý vào ban đêm chẳng hạn) và hạn chế số lượng robot chạy đồng thời phù hợp với tình trang host của bạn.
Ngoài ra, ở phiên bản trước trong quá trình lấy tin có gặp 1 lỗi liên quan đến vòng lặp khiến cho tiêu tốn 1 lượng resource nhiều hơn bình thường. Lỗi này đã được phát hiện 1 cách tình cờ và fix ở phiên bản 1.2.0
HHIT says
Bản này bạn vẫn chưa public à, nếu được bạn có thể gửi cho mình test mới được không. Mail của mình: [email protected]
duong says
Hi, tìm kiếm thông tin về robotvn kéo em đến trang này, bác cho em hỏi là bản 1.2 bao giờ bác làm xong, làm xong thì thương mại hay free. Đặt gạch chờ bản chính thức của bác
HHIT says
Mà đợt này http://vnwebmaster.com/ bị gì mà vào toàn bị trả về lỗi 404.
Blog Cơ Khí says
Cung hỉ, cung hỉ bác, chúc “đứa con” này của bác khỏe mạnh để anh em được nhờ >:D<
Minh Tuan says
download o dau the ?
Nguyen Anh says
Em chưa được sử dụng phiên bản này
nhưng phiên bản 1.1 hiện bị lỗi duplicate bài (khi server lag)
hi vọng a khắc phục được lỗi này
Nguyễn Duy Nhân says
Mình tìm được lỗi duplicated của Tuổi Trẻ do báo này sử dụng cơ chế redirect page (link lúc đầu khác link chứa nội dung). Vẫn đang loay hoay tìm 1 giải pháp thỏa đáng cho nó =P~
Nguyen Anh says
Ko riêng báo tuoitre đâu anh ạ
em đang chạy thì gần như báo nào cũng bị Duplicate hết
Có khi 1 bài trùng đến 5-7 lần
Thường thì lúc server không lag thì ko sao
nhưng mỗi lần Server bị lag thì trùng bài 100% xảy ra
Cũng có thể là vì lag mà bot quét qua link đó mấy lần (vì tưởng chưa quét)
nên có thể khắc phục bằng cách đánh dấu link đã quét rồi
Quý Phát Entertainemt says
Tui ủng hộ bác làm cái Robot VN này đấy. Chúc bác thành công…
À. Mà bác đừng share. Bán đi. Tui sẵn sàng mua!
Nguyễn Lê Quý Phát Director!!!
:) :) :)
Nguyễn Duy Nhân says
Bác mua chưa em bán luôn ;))
Blog Cơ Khí says
Giá hữu nghị cho anh em là bao nhiêu bác? :D
Nguyễn Duy Nhân says
Chưa dự định bán. Nhưng tùy lòng hảo tâm. Heheheh ! Donation bao nhiêu thì happy cả làng nhỉ :D
Blog Cơ Khí says
Hehe, thế cũng hay bác, mình mà dùng nó kiếm được xiền thì hậu tạ cũng dễ hơn ;))
Orman Clack says
Robot VN? It sounds like just post wp-automatic robot?
if it really good? $ 105. I can buy?
Quý Phát Entertainment says
Có người trả bác 105 $ kìa…^^
=)) =)) =))
Quý Phát Entertainment says
Nếu bác bán với giá khoảng 200 VND thì có lẽ em có điều kiện mua đấy…
=)) =)) =))
Orman Clack says
Robot VN? It sounds like just post wp-robot?
if it really good? $ 105. I can buy?
shop thoi trang says
Lỗi duplicate của nó hao tốn ổ cứng kinh khủng, hi vọng bản mới bác sớm khắc phục vấn đề này.
Chúc blog của bác ngày càng lớn mạnh. Thanks you so much!
iZ-W says
Chừng nào xong thế Nhân, đợi quá lâu.
Nguyễn Duy Nhân says
Híc ! Đang phải ngừng tất cả để tập trung hội thảo SEO Idol 2011 ngày mai bác ah. Sau hội thảo mới tính tiếp được vì mình là phó BTC nên ko bỏ được rồi.
Girl Baby Xinh says
Kể ra Lão Nhân này cũng giỏi phết ấy nhỉ???
Chúc mau chóng làm ra Robotvn mới nhé…!
;):x ;):x ;):x
Gia Nong San says
theo e gia cua plugin nay tam 120k den 200k la phu hop :D
xem tu vi tron doi mien phi says
Các bác có ai biết cái plugin này tên gi ko vậy?
Ảnh dưới nè gì tìm hoai ma ko ra:
http://tC2.upanh.com/thumbpic/26.853.34078601.sU50/tag.120×1.jpg
xem tu vi tron doi mien phi says
mà mình click vô là nó xoay vòng tròn đó…
Ohmylove Cnet says
Mong bác làm xong rồi cho em xài với nhé!!!
Cố gắng lên nhé!
:) :) :)
nguyenvanba says
hi bác,
con robotvn của bác seo rồi, minh đang chờ đợi để thử nó, không biết bác đã fix xong chưa? :P
BaoNongSan.Com says
thang 9 rui ! hom nay la mung 9/9 rui ma ko thay bac Nhan nha ta cho ban beta nhi
clip hay says
lâu wa’ bác Nhân ơi !! E chờ dài cả…….râu rùi nà :D
Huy says
Nếu robot này hỗ trợ vietnamnet.vn thì tuyệt vời quá bác ơi =D>
Chung says
Mình đang chờ phiên bản này. Hy vọng bác ra sớm :)
Nguyễn Duy Nhân says
Đã lấy domain laytintudong.net về đặt gạch cho cái plugin này rồi. Cuối tháng này sẽ xong trang này.
Hùng Nguyễn says
Mong chờ quá :kill:
newbie says
Bac nhan som hoan thanh cho ae xai ké hoặc bán cũng ok >:D<
Anonymous says
Nên share cho mọi người học tập đi. Vì thương mại cũng chẳng được mấy người, người cần thiết thì không có được vì không có điều kiện, vậy thì làm và quảng cáo để làm gì chứ
Vũ says
Anh Nhân share cho anh em đi, em đang cần nó, có gì thì quyên góp ủng hộ chứ đừng làm thương mại :((
Hùng Nguyễn says
Nếu được bác có thể vui lòng share cho mình xin 1 bản được không >:D<
Nguyễn Trung says
bác Nhân ơi cho em hỏi chút! cái send mail ở phiên bản nhận web trước bác dùng plugin j vậy? thank bác nhiều >:D<
Quỳnh Nhi says
Anh à, anh cứ thương mại đi! Giá khoảng 400–900 ngàn gì đó! Chia ra nhiều bản như :
Lite
Professional
Enterprise…………..
Gì đó là tùy! Nhưng nhớ Security chút, đừng để bị Crack! và làm nhanh lên!
Lâu thế này. Lòng tin mọi người sẽ giảm nhiều lắm đó! =)) =)) =))
Nguyễn Duy Nhân says
Chắc khoảng cuối tháng này có hàng cho mọi người, hiện nay NhanWeb chậm cập nhật cũng vì lý do này.
Quỳnh Nhi says
Chúc anh thành công! :) :) :)
Nguyen Lac says
Có hàng chưa bác Nhân ơi, sao lâu thế bác, có trục trặc gì ah?
Tên vi phạm says
Dự án này của bác thế nào rồi ạ?
Phuong says
Bác nhân làm con Robot xong chưa share giúp mình với, mình đang cần nó…
[email protected]
Hieu says
Mong chờ bác nhân share con robot này cho mọi người.
Phạm Nguyễn says
Warning: file_get_contents(http://search.vnexpress.net/news?s=sim+s%E1%BB%91) [function.file-get-contents]: failed to open stream: HTTP request failed! HTTP/1.1 400 Bad Request in C:AppServwwwwordpresswp-contentpluginsrobotvnsimplehtmldomsimple_html_dom.php on line 39
Warning: file_get_contents() [function.file-get-contents]: php_network_getaddresses: getaddrinfo failed: No such host is known. in C:AppServwwwwordpresswp-contentpluginsrobotvnsimplehtmldomsimple_html_dom.php on line 39
Warning: file_get_contents(http://thethaovanhoa.vnhttp://thethaovanhoa.vn/xa-hoi/cuop-sim-so-dep-n20110726101224006.htm) [function.file-get-contents]: failed to open stream: php_network_getaddresses: getaddrinfo failed: No such host is known. in C:AppServwwwwordpresswp-contentpluginsrobotvnsimplehtmldomsimple_html_dom.php on line 39
Fatal error: Call to a member function find() on a non-object in C:AppServwwwwordpresswp-contentpluginsrobotvnrobot.php on line 254
Chẳng biết bị sao nữa. Mình đang chạy trên localhost
TuNguyen Design says
Bác Nhân ơi…cho mình hỏi Bác tí về cái Plugin RobotVN
Mình đang chạy demo wordpress 3.5.1…. không biết Plugin này có hỗ trợ cho wp 3.5.1 ko vậy Bác…. với lại mình đang chay tren localhost thi co ok ko Bác
Thanks Bác!
hai says
Warning: file_get_contents(): Couldn’t resolve host name in /home/u166499995/public_html/wp-content/plugins/robotvn/simplehtmldom/simple_html_dom.php on line 39 Warning: file_get_contents(http://thethaovanhoa.vnhttp://thethaovanhoa.vn/bong-da-anh/chelsea-hop-bao-cong-bo-tan-hlv-mourinho-khong-con-dac-biet-n20130610212202814.htm): failed to open stream: operation failed in /home/u166499995/public_html/wp-content/plugins/robotvn/simplehtmldom/simple_html_dom.php on line 39 Fatal error: Call to a member function find() on a non-object in /home/u166499995/public_html/wp-content/plugins/robotvn/robot.php on line 254
bản 1.1.0 bấm đăng tin ngay thì lỗi thế này
Tên vi phạm says
Mong anh share cho mọi người đi. Còn trả phí thì 100k/tháng thui. :D
Phú đẹp trai says
Bị tin trùng (báo cùng nguồn luôn).
Bác có biết sao hem
http://mrdt.net/ban-gai-hot-girl-cua-tran-thanh-khoe-nha-dep-lung-linh-2/
http://mrdt.net/ban-gai-hot-girl-cua-tran-thanh-khoe-nha-dep-lung-linh/
Suzy Ohh says
Em thích Plugin này rồi bác ạ! :D
Sexility says
:D Plugin ngon, em xin bản Free về làm site news đây =D