30/09/2018, 21:04

Có ai hứng thú với Big Data không?

Mình thấy Big Data đang là xu hướng công nghệ và nghề nghiệp đã và đang nổi lên. Nhu cầu về Big Data được chú trọng từ khi bùng nổ Social Network. Các chuyên gia trong lãnh vực này đang được săn đón và vì thế Big Data đang là một chủ để rất hot. Các forum nước ngoài và các nhóm chuyên đề hay được mở ra để bàn về Big Data. Mình thì cũng biết chút đỉnh, cũng đang muốn mở mang thêm kiến thức, vì thế mình mạo muội làm một topic nho nhỏ, để mọi người có cùng quan tâm thì vào chia sẻ chém gió tí, biết đâu làm được cái nhóm offline thì vui hehe.
Ai hưởng ứng thì làm tí nhé.!!!

lx viết 23:19 ngày 30/09/2018

Chào bạn, ý tưởng rất hay.

Mình có cái này đang tìm hiểu, thì theo bạn với data tầm vài chục gb (20gb chẳng hạn), thì nên giải quyết kiểu gì. Mình đang tính tìm hiểu tensorflow với spark đẻ giải quyết (nhưng tới h hầu như cũng chưa biết gì @@). Mong được bạn chia sẻ

Nguyễn Văn Cờ Đỏ viết 23:08 ngày 30/09/2018

nếu bạn muốn cuối tuần mọi người ra coffee làm quen, chia sẻ kinh nghiệm và hướng đi mới về big data. mảng này đang nổi lên tại thị trường việt nam.

Hung Nguyen viết 23:18 ngày 30/09/2018

Trước thấy nó nổi cũng có một thời gian tự học, tự mày mò tìm hiểu về nó. Cũng cài hadoop, viết mấy task Map-Reduce đơn giản bằng eclipse như wordcount, tìm max temperatures rồi chạy thử :D. Download cuốn “Hadoop definitive guide” của Tom White đọc. Nhưng về sau nhu cầu công việc không cần lâu rồi chả động gì đến cả :))

Phan Hoàng viết 23:10 ngày 30/09/2018

Big Data phải có case thực hành thì mới lên trình nhanh được. Hình như có 1 số doanh nghiệp họ expose 1 số cái Big Data cho mọi người cùng thực hành, phân tích -> report. Mình cũng chưa làm mảng này bao giờ, chỉ có 1 số case na ná: hệ thống ghi số điện theo ngày, và call_log của 1 callcenter.

Itachi Citus viết 23:16 ngày 30/09/2018

Spark dùng cho big data mà anh, dữ liệu nhỏ nó chạy không hiệu quả lắm đâu, 20GB thì chỉ là “medium data” thôi .

Pham Van Quan viết 23:05 ngày 30/09/2018

Spark với dữ liệu nhỏ chạy vẫn tốt nhé, nó được thiết kế kiểm soát các task rất tốt chứ không phải cứ Spark là phải dữ liệu cực lớn đâu bạn.

Itachi Citus viết 23:08 ngày 30/09/2018

Nhưng với dữ liệu tầm 20GB thì pandas, scikit learn sẽ có hiệu năng tốt hơn và dễ dàng sử dụng hơn là phải cài nguyên một bộ “dao mổ trâu” như spark .

Tiến Hoàng viết 23:13 ngày 30/09/2018

Xem phim Valley Silicon nén 1 phim 3D khủng từ hơn 100Gb xuống còn 25Gb :v Bigdata hay đấy.

Dau Minh Hoa viết 23:06 ngày 30/09/2018

để trở thành Data Scientist thì nền tảng học vấn là CS hay SE anh em?

kid1412 viết 23:20 ngày 30/09/2018

cho mình tham gia với nhé ý tưởng hay

chu tước viết 23:20 ngày 30/09/2018

Anh có thể lập ra một nhóm học tập về big data rồi đặt vấn đề cho mọi người nghiên cứu và cùng bàn luận được không ah?

Dương Đình Vũ viết 23:19 ngày 30/09/2018

sáng thay thấy Viettel đăng tin tuyển Big Data Scientist lương 60-80 củ khoai
không biết có ai thích k

deep learning viết 23:19 ngày 30/09/2018

Mình đọc thấy thì hình như big data không có nghĩa là cứ phải lượng dữ liệu phải lớn :3 mà còn có cả sự phức tạp của dữ liêu cũng gọi là big thì phải, mới đọc dạo qua thấy thế :3

Nap Fvn viết 23:06 ngày 30/09/2018

Tạo Group facebook cho Anh Em thảo luận, cùng tìm hiểu đi bác.

EM cũng học Python xong nên học nó cho dễ

Nguyễn Vạn Nhã viết 23:17 ngày 30/09/2018

mình cũng đang nghiên cứu về bigdata mản machine learning vẫn gà quá

Phan Hoàng viết 23:10 ngày 30/09/2018

Link đây: https://www.facebook.com/ViettelRecruitment/
Trên trang chủ của Viettel thì thấy xoá rồi, còn mỗi cache:
http://webcache.googleusercontent.com/search?q=cache:Deoc2xna-8MJ:vietteltelecom.vn/index.php/chi-tiet-tin-tuc/thong-bao-tuyen-dung+&cd=1&hl=en&ct=clnk

Dev cũng toàn 40-60Tr / 1 tháng nhé ^^

lx viết 23:08 ngày 30/09/2018

Oh vậy sao? Để anh thử với pandas + scikit xem, nhưng anh ko nghĩ hiệu suất nó đủ tốt để mình train model các thứ :/. Chắc anh thử xong sẽ review lại, hôm bữa có xài thử h2o thấy chậm khiếp luôn.

Spark thì hệ thống sẽ có người cài, chỉ việc xài thôi, nên cũng là cơ hội rèn luyện tốt.

Quả là chủ đề hot, nhiều người cmt ghê. Riêng chủ topic thì chưa thấy đâu hehe

Tung viết 23:11 ngày 30/09/2018

Sorry mọi người, bữa giờ bận đi công việc đột xuất nên không ghé thăm forum thường. Thấy mọi người hưởng ứng mình vui lắm. Big Data là một mảng khá mới ở VN mà Phan_Hoang nói phải có thực hành và trao đổi kiến thức thì mới lên được. Thấy mảng này thơm tự mày mò học nhưng không biết thực hành và trao đổi với ai để mau lên. Học trên Coursera thì chỉ dừng ở căn bản thôi.

Vậy mình lập group heng. Mình làm online trước. Khi nào đông đông thì offline. Mọi người thấy sao?

Nap Fvn viết 23:11 ngày 30/09/2018

lập Group đi bác.
Cho ae cùng hướng đi chung luôn.
Em cũng đna ghọc Machine Learning trên Coursera, nên BigData sẽ học song song luôn.

Tung viết 23:14 ngày 30/09/2018

mọi người cho mình cái email nhỉ mình tạo cái group nho nhỏ trên facebook nhé, mình sẽ email invite em anh. Mọi người join group này nhé

https://www.facebook.com/groups/1133232316699471/

Nếu ko join được thì inbox mình qua facebook cá nhân. Mình sẽ add dzô nha. Cám ơn anh em.

facebook.com

Tung Nguyen

Tung Nguyen is on Facebook. Join Facebook to connect with Tung Nguyen and others you may know. Facebook gives people the power to share and makes the world more open and connected.

Bài liên quan
0