Tuesday, November 29, 2016

Friday, November 18, 2016

Big Data : Nhu cầu thị trường - Định hướng nghề nghiệp - Tính chất công việc

Tập hợp một số câu hỏi từ bạn trên page https://www.facebook.com/bigdatavn và từ các buổi thuyết trình ở Barcamp


1. Làm việc trong ngành này như Data Analyst, Data Engineer và Data Scientist họ thường làm những công việc gì trong công ty?Làm ở những công ty nào? Mức lương thông thường là bao nhiêu?



Cấu trúc team làm về Data trong 1 tổ chức tiêu biểu ứng dụng Data-driven business 

 Data Analyst, Data Engineer và Data Scientist thường sẽ làm việc cùng nhau chung trong 1 team, thường gọi là Data Engineering hay Data Analytics hay Data Science team.





Làm những công việc gì trong công ty? 

  • Phân tích dữ liệu từ nhiều nguồn: Social Media (Facebook, Twitter ,...) , CRM , Google, truyền thông online, doanh số bán hàng, hành vi khách hàng, dữ liệu Marketing, dữ liệu Sale, ...
  • Đưa ra các báo cáo (Reports) từ kết quả phân tích để giúp ích cho việc vận hành hoạt động kinh doanh dễ dàng hơn trong thời đại số hóa.


VD ứng dụng Big Data để tối ưu quy trình Bán hàng Online trên Internet 

Làm ở những công ty nào?


  • Công ty thì không giới hạn, vì hầu như tất cả công ty đều có dữ liệu và có nhu cầu phân tích để tìm ra lợi thế cạnh tranh trong thời mọi thứ sẽ được số hóa (Digitization )
  • Phổ biến ở Tài chính (Sentifi, Momo, ..), Viễn thông (FptTelecom, Viettel), Media (Digital Marketing, Advertising ) và các công ty về Tech như Uber, Lazada, Grab, Tiki, VNG , Zalo, ..




Mức lương thông thường là bao nhiêu? (ở Vietnam thôi nhé )


  • Trung bình từ $500-$800 với các bạn Junior
  • Trung bình từ $900-$2000 với các bạn Senior 




2. Ngành này ở VN đã phổ biến chưa? Cơ hội nghề nghiệp của ngành này ở VN có cao không?


  • Đây là xu hướng chính và tốc độ phát triển giữa nhu cầu thực tế, nhu cầu xã hội và dữ liệu việc làm thì nó sẽ còn phát triển nóng ít nhất trong 3-4 năm nữa , đặc biệt ở lĩnh vực FinTech, Banking, Digital Advertising, Marketing, Social Media và các công ty làm về Tech .






3. Ngành Phân tích dữ liệu và Khoa học dữ liệu này có khác gì với ngành Phân tích dữ liệu ở các công ty Nghiên cứu thị trường như Neilsen, Buzzmetric hay Boomerang? Những công ty này có thuê Data Analyst, Data Engineeing và Data Scientist không?




  • Bản chất  Neilsen, Buzzmetric hay Boomerang là những công ty Nghiên cứu thị trường (hiểu nôm na là tìm hiểu nhu cầu tiêu dùng khách hàng, tại sao họ là chi tiền,...), 
  • Hoạt động theo mô hình Traditional Market Research hoặc được xây dựng Business theo mô hình Data-driven. Họ chưa đủ sự đa dạng dữ liệu như các công ty lớn Facebook, Google. 
  • Những công ty này có thuê hoặc Outsourcing các công ty IT để xây dựng hệ thống Software dùng để tăng cường khả năng phân tích dữ liệu.
  • Phương pháp methodology của họ vẫn dựa trên các mô hình thống kê cổ điển nên sẽ có nhiều mặt hạn chế trong tính chính xác và thời gian cho ra kết quả
  • Trong khi sự phát triển các mô hình Toán học , Cloud Computing, Machine Learning và Thuật toán dự đoán market đã tiến rất xa. 
VD: Một công ty dùng phân tích cổ điển để làm Market Research cho 1 sản phẩm mới, các họ dùng sẽ là đi làm survey trên 1 tập customer, đi thu thập sale data từ các nhà phân phối , hay đi mua dữ liệu từ các agency quảng cáo. Quá trình phân tích trên mô hình thống kê phổ biến .
Tham khảo thêm 


Ứng dụng Big Data vào Marketing và CRM
Bạn có thể tham khảo thêm mô hình Analytics ở lĩnh vực Quảng cáo từ Harvard Business Reviews ở đây:
https://hbr.org/2013/03/advertising-analytics-20



Các tựa sách tham khảo cho các bạn làm Kỹ thuật 😉


Tuesday, November 8, 2016

Tìm ra tổng thống Mỹ nhờ dữ liệu

Với việc khởi động dự án bầu cử vào năm 2016, dữ liệu lớn và dữ liệu xã hội sẽ xác định vị tổng thống tiếp theo của Mỹ.
Allthingsd cho biết, cuộc bầu cử tổng thống Mỹ đồng nghĩa với mùa làm ăn lớn của ngành công nghiệp quảng cáo. Với số tiền khổng lồ 6 tỷ USD chi cho quảng cáo trong trong năm 2012 trên tất cả phương tiện truyền thông, cuộc bầu cử năm ngoái đã phá vỡ kỷ lục ở số phiếu bầu và ở trong phòng họp. Đây cũng là cuộc bầu cử đắt nhất trong lịch sử nước Mỹ tính đến nay, với số tiền vượt hơn 700 triệu USD so với cuộc bầu cử đắt nhất trước đó.
Với việc khởi động dự án bầu cử vào năm 2016, vai trò của dữ liệu lớn và dữ liệu xã hội trong các quyết định ảnh hưởng đến kết quả của cuộc bầu cử là không thể bỏ qua. Trong năm 2008, chính dữ liệu xã hội đã dàn xếp kết quả cuộc bầu cử, và đến năm 2012, dữ liệu lớn đã đảm nhận vai trò này. Vào năm 2016, chính sự kết đôi của cả hai sẽ xác định vị tổng thống tiếp theo của nước Mỹ.
d
Trong năm 2012, chính dữ liệu lớn đã dàn xếp kết quả cuộc bầu cử. Ảnh: Reuters.
Trở lại năm 2008, tầm ảnh hưởng của xã hội trực tuyến vẫn còn trong giai đoạn phôi thai. Trong khi mọi người đổ xô đến các mạng xã hội như Facebook và Twitter để chia sẻ suy nghĩ và tác động lên những người khác, thì đây vẫn chưa phải là một cách thức để đo lường tầm ảnh hưởng ngoài cảm nhận tổng thể.
Phương tiện truyền thông xã hội cũng tương tự như cách tiếp thị du kích, nhưng những công cụ này rất có tác dụng trong việc để người dân bày tỏ ý kiến về các chính sách đang được thảo luận; và điều này có thể ảnh hưởng đến kết quả của cuộc bầu cử. Những người muốn có sự thay đổi và không ngại chia sẻ ý kiến của mình trong các cuộc thảo luận công khai và các cuộc thảo luận mang tính toàn cầu khuyến khích những người khác bước vào phòng bỏ phiếu và bỏ lá phiếu bầu của mình.
Trò chơi với những con số
Năm 2012 đánh dấu sự phát triển của khoa học dữ liệu chính trị và dữ liệu lớn, cách để các nhà quản lý và chiến dịch thăm dò dư luận thu thập ý kiến công chúng về mỗi ứng cử viên, so sánh với dữ liệu cuộc bầu cử tại từng bang và ghép tất cả các mảnh lại thành một chiến dịch chính trị toàn diện cho mỗi phe. Chuyên gia toán học và nhà phân tích dữ liệu sẽ biến khối dữ liệu khổng lồ mà họ nắm rất rõ trong lòng bàn tay thành những thông tin mục tiêu hành động để thuyết phục các cử tri tiềm năng trên toàn quốc và tại các bang chiến lược.
Một ví dụ về sự tập trung vào số học trong cuộc bầu cử năm 2012, mốc tính toán quan trọng nhất, 7,9% là tỷ lệ thất nghiệp và là mức thấp nhất trong nhiệm kỳ tổng thống của ông Barack Obama. Con số này chỉ nhỉnh hơn một chút so với tỷ lệ thất nghiệp 7,6% mà ông Obama đã tiếp nhận vào tháng 1/2009. Bằng cách nhấn mạnh chỉ một con số này, chiến dịch của ông Obama đã có thể làm nổi bật những tiến bộ hướng tới việc cải thiện nền kinh tế quốc gia, xây dựng lòng tin ở các tri rằng ông đã đi đúng hướng.
Theo báo cáo của tờ Wired, bằng chiến thắng trong cuộc bầu cử được xem là “xuẩn ngốc nhất trong lịch sử nước Mỹ” (nerdiest election in the history of the American Republic), Barack Obama đã củng cố vai trò của Big Data trong mọi khía cạnh của quá trình vận động. Thành công của ông đến từ những nỗ lực trong việc gia tăng số phiếu bầu bằng cách chi phối bởi những thông điệp mục tiêu và dữ liệu theo dõi hành vi kỹ thuật số.
Dữ liệu lớn + dữ liệu xã hội = tổng thống kế tiếp
Hashtag là tính năng này giúp người dùng Facebook có thể dễ dàng liên kết với nhau với những chủ đề tương đồng nhau qua dấu # mà không cần phải gia nhập các nhóm (Groups), trang (Pages) hay fanpage Facebook.
Điều mà phương trình dữ liệu lớn còn thiếu đó là cách ảnh hưởng xã hội, dữ liệu di động và tài sản CRM (quản lý quan hệ khách hàng) có thể tác động lên kết quả của một chiến dịch khi được khai thác một cách nhanh chóng và hiệu quả. Tiếp thị dựa trên dữ liệu đã loại trò chơi dự đoán ra khỏi quảng cáo, và các công nghệ mới như hashtag đang dần trở thành phương tiện truyền thông xã hội lan truyền sang phương tiện truyền thông trả tiền. Chẳng hạn, như Tweeter và chia sẻ xã hội đã trở thành banner giới thiệu về các ứng viên tổng thống trên màn hình máy tính và điện thoại di động.
d
Các chuyên gia dự đoán, vào năm 2016, chính sự kết đôi của dữ liệu lớn và dữ liệu xã hội sẽ xác định vị tổng thống tiếp theo của nước Mỹ. Ảnh: Internet.
Trong cuộc bầu cử năm ngoái, bất cứ nơi đâu bạn đến trong môi trường trực tuyến, những chiến dịch của ông Obama và ông Romney đều theo sau bạn nhờ công nghệ Ad Retargeting (là một công nghệ quảng cáo trực tuyến mà chỉ tập trung vào những khách hàng, những người đã truy cập vào website của bạn).
Các thuật toán của Big Data cho phép các nhà quảng cáo và những người làm chính trị có được những khách hàng trực tuyến mục tiêu tốt hơn dựa trên các tương tác xã hội của họ trên web và Facebook. Những dữ liệu xã hội quan trọng này cùng với dữ liệu định vị điện thoại di động và dữ liệu CRM (dữ liệu quản trị khách hàng) chính là nguồn nhiên liệu tạo nên những mẩu quảng cáo bắt mắt cho chiến dịch trên môi trường trực tuyến, trên điện thoại di động và Facebook.
Với hơn 10 tỷ sự kiện được chia sẻ trên các phương tiện truyền thông xã hội, dữ liệu lớn đang được tạo ra từ mỗi giây qua việc like và share, và tại bất kỳ nơi nào chúng ta đến trên trái đất này thông qua điện thoại di động. Các nhà quản lý chiến dịch thông minh và các nhà quảng cáo thương hiệu đang tìm ra những cách thức mới để thông qua các dữ liệu này cung cấp cho khán giả một trải nghiệm người dùng liên tục khi họ di chuyển giữa các kênh và điểm cảm ứng trên máy tính, thiết bị di động và máy tính bảng.
Dữ liệu xã hội về cơ bản đã thay đổi cách các nhà quảng cáo tiếp cận nghệ thuật tiếp thị. Hiện nay, chúng ta có thể quan sát, theo dõi rất nhiều thứ qua môi trường trực tuyến. Sự thay đổi trung tâm dữ liệu trong quảng cáo đã cho phép các đảng chính trị cải tiến cách tiếp cận chiến dịch để tới gần hơn với kết quả và không thể phủ nhận đây là sự kết hợp “làm bàn” đẹp mắt giữa dữ liệu xã hội, dữ liệu lớn với mục tiêu phấn đấu để tìm ra vị tổng thống Mỹ mới vào năm 2016.