The Google File System
Patterns
- 檔案都很大,以GB為單位 (現在說不定更大)
- 檔案的修改,大部分是
appending,少部分是overwriting - 寫完以後通常就是
read only,而且通常是sequential的讀
Design Assumptions
- 用
commodity的機器相連,所以hardware failure是家常便飯 - 大部分是
large streaming reads和少數的random read - 比起latency,throughput更重要
Architecture

Single Master
為了簡潔,是 single master