Cơ chế của master-worker trong google cloud ml?
Mình đang sử dụng Google cloud ml cho việc training dữ liệu, và gặp vấn đề với lỗi Out of memory. Mình có xem trên docs thì thấy google có ghi là master có nhiệm vụ quản lý các worker còn lại, đồng thời ghi logs cho job link here. Nhưng không thấy đề cập đến việc share memory giữa master và worker như thế nào. Liệu ở thời điểm ban đầu khi quá trình training diễn ra thì master sẽ load toàn bộ dữ liệu vào trong RAM sau đó mới chia cho những worker khác hay ngay từ đầu quá trình share memory đã được diễn ra nhỉ?