Kết quả ban đầu khi đáng từ film để tìm các từ liên quan (unsupervised training ):
Enter word or sentence (EXIT to break): movie
Word Cosine distance
------------------------------------------------------------------------
film 0.726205
movies 0.724130
films 0.704162
remake 0.646792
batman 0.640161
blaxploitation 0.629710
gojira 0.620710
animated 0.615535
cartoon 0.611009
toho 0.606068
highlander 0.605127
kaiju 0.604210
godzilla 0.596378
starring 0.592826
soundtrack 0.58806
trờ về quá khứ tí, cách đây 6 năm, vào những năm 2007, bị ám ảnh bởi mô tả về cách các hàm vận động (functor) giữa các hệ thống do thầy Peter (http://peteg.org/), thầy huớng dẫn của mình đề cập.
Thực tế đến giờ thắc mắc vì khá trừu tuợng. Lập ra cái blog http://activefunctor.blogspot.com/ để viết ra cho nó hại não tí.
Cùng thời gian này, 1 số các open source về big data (cụ thể là Hadoop - Map Reduce) bắt đầu hình thành sau khi Google publish cái paper này
Lịch sử đã nói rằng, có cầu thì sẽ có cung. Sự ra đời của các framework về big data , text analysis để giải quyết các vần đề trên là tất yếu.
Hôm nay, đọc vài bài về deep learning
http://gigaom.com/2013/08/16/were-on-the-cusp-of-deep-learning-for-the-masses-you-can-thank-google-later/
http://venturebeat.com/2012/11/25/deep-learning/
http://gigaom.com/2013/11/01/the-gigaom-guide-to-deep-learning-whos-doing-it-and-why-it-matters/
Nếu cho có robot crawler đi index các thông tin trên facebook thì sao ?
Xem bài post này sẽ rõ, ít nhất mình đã nghĩ ra từ năm 2011