Pages

Friday, April 25, 2014

Tại sao mc2ads nhiều thông tin chuyên môn có ích ? Tại sao là Rfx có ích cho big data developer ?

Tại sao mc2ads có nhiều thông tin chuyên môn hữu ích ?
mc2ads vốn là tâm huyết, sở thích của mình về 1 trang blog và tin tức chuyên ngành về mảng công nghệ xử lý dữ liệu lớn (big data processing).
Mình đọc, lựa chọn và biên tập các thông tin từ trên các nguồn khác nhau từ Internet, cả kinh nghiệm và kiến thức bản thân cũng đưa vào đây.
mc2ads là nơi chia sẻ kiến thức, xây dựng cộng đồng để cùng nhau Research & Development những ý tuởng một cách TỰ DO SÁNG TẠO nên không có tiền bạc hay kinh doanh gì cả NON-PROFIT (không có quảng cáo trên trang này, không chuyên giao công nghệ, không bán công nghệ).

Ngoài ra, mc2ads còn là 1 lab, thực hành và chia sẻ các ý tuởng khả thi và có ích. Làm CNTT không nhất thiết phải như mấy ngành ghê gớm khác, phải đầu tư nhiều tiền để research.
Các thí nghiệm trong trí tuởng tuợng là đủ, biến chúng thành hiện thực , thành cái có ích thì quá tuyệt.

Vì là blog nên nhiều lúc nó lộn xôn (vừa tiếng Anh để share cho dân Tây trên Twitter , vừa tiếng Việt để share trên Facebook cho bạn bè đọc) , mình đang xài blogger của Google với customized domain là mc2ads.com cho nó dễ nhớ. Tuy nhiên sắp tới sẽ vài thay đổi để dễ tìm content hơn.

Số liệu thống kê của mc2ads từ 2011 đến 2014 là như sau, nó chỉ tăng cao nhất từ đầu năm đến nay.

Trong số các bài viết trên mc2ads, bài có pageview và refer từ US cao nhầt là:
http://www.mc2ads.com/2014/02/install-apache-spark-and-fast-log.html

Một phần traffic cao là nhờ bài này đuợc 1 tác giả Alvin J Alexander, chuyên viết blog và sách về lập trình có tiếng refer tới (thanks Alvin a lot)


Tìm hiểu thêm ở các links sau: 
http://alvinalexander.com/photos/install-apache-spark-and-fast-log-analytics

Tại sao là Rfx là framework có ích cho big data developer và sinh viên ?
Nếu là nguời trong ngành, bạn có thể so sánh nó với Storm (http://storm.incubator.apache.org/)  hay Spark (http://spark.apache.org/), nhưng sự thật mình tạo ra nó không phải để "ăn thua" với 2 cái kia.
Mình đã từ research cà 2, từng Go Production với Storm hơn 1 năm trời, cho nên mình thấy nó có vài khuyết điểm cần bổ sung.
Big Data rất rộng lớn, ứng dụng rất đa dạng nên 1 tool không phù hợp tất cả mọi vấn đề.

Bạn có thể nói Storm là từ Twitter, Spark là từ đại học Berkeley danh tiếng còn Rfx chỉ là nguời Việt Nam bình thuờng làm ra.
Rfx đuợc thiết kế cho sinh viên học trong vòng 1 tiếng là có thể code đuợc 1 cái app xử lý big data (real-time, scale and simple). Cho nên mục đích thiết kế là Rfx rất bình thuờng cho những ai thích cũng hiểu và code đuợc.
“Make things as simple as possible, but not simpler.”
Tuy nhiên, càng đi sâu, bản thân Rfx dựa trên mô hình tóan, do mình đã học từ thầy Peter lúc đi thực tập ở DRD. Xem ở đây nhé http://www.mc2ads.com/2014/04/mot-cau-chuyen-tu-lambda-en-java-8.html
Tóm lại, Rfx là tâm huyết và là ý tuởng đã ấm ủ từ thời sinh viên (2007) về 1 hệ thống xử lý dữ liệu phân tán và có khả tự liên kết các môi quan hệ thông tin lại với nhau theo mô hình xác suất (functor) để làm máy tính xử lý giống như 1 bộ não người, chứ kg phải tự nhiên mà có (làm theo phong trào big data blah..blah..)

Rất may là làm ở FPT Online, có nhiều bài tóan big data để mình giải nên có nhiều kinh nghiệm (hơn 1 năm trời với cái eclick), nên tập hợp nó lại thành 1 framework vừa code cho nhanh, vừa để cộng đồng chuyên môn đóng góp thêm và để ứng dụng lý thuyết và thực tế.

Code nó ở đây: bạn có thể tự tìm hiểu:
https://bitbucket.org/trieunt/rfx/wiki/Home

Tài liệu thì ở đây: http://www.mc2ads.com/p/rfx-for-big-data-developer.html
Vì thời gian mình dành công ty cũng hết ngày rồi nên mình đang viết khi rảnh, (buổi tối và T7, chủ nhật thôi)

Thôi nhé, tạm là thế.