O tempo de execução do Go inclui um escalonador que multiplexam muitas goroutines em um pequeno número de threads do SO. Este escalonamento M:N (M goroutines em N threads do SO) é o que torna as goroutines tão baratas e a concorrência do Go tão escalável. Entender isso explica o desempenho das goroutines.
O modelo G-M-P
G (Goroutine) — your concurrent task (lightweight, ~2KB stack to start)
M (Machine) — an OS thread (the actual thread the OS schedules)
P (Processor) — a logical processor / scheduling context; holds a queue of runnable Gs
(the number of P's = GOMAXPROCS, default = number of CPU cores)
The scheduler runs G's on M's, coordinated through P's:
Each P has a local run queue of goroutines; an M must hold a P to run G's.
