die wird irgendwoe in der vm liegen.
Aber ich glaube der Füllstand ist garnicht so interessant, imho sollte er auch nicht als Skalierungs-Input sondern eher als Output verstanden werden.
Interessanter sind doch Messungen wie: Anzahl von Verbindungen pro Sekunde (Durchschnitt, maximum), Anzahl von bearbeiteten Verbindungen pro Sekunde (Durchschnitt, Maximum, intelligenter Durchschnitt von bearbeiteten Verbindungen unter großer Last)
Von diesen Werten sollte nun die Anzahl von überhaupt möglichen aktiven Verbindungen abhängen, um den Server nicht zu schlachten müssen diese ja begrenzt werden. Das Backlog wird also eigentlich nur benutzt, wenn der Server komplett ausgelastet wird (manchmal landen warscheinlich doch ein paar verbindungen drin, weil der Server grad was anderes als die Annahme neuer Verbindungen zu tun hat, aber die sollten da schnell wieder rauskommen).
Das Backlog sollte nun also so groß gewählt werden, dass alle enthaltenen Verbindungen in sinnvoller Zeit bearbeitet werden können. Definieren muss man also 'sinnvolle' Zeit. Sagen wir eine Sekunde. Das Backlog sollte also maximal so groß sein, wie die Anzahl der Verbindungen die im Durchschnitt pro Sekunde verarbeitet werden.
Warscheinlich würde man es aber eher etwas kleiner wählen. Jede angenommene Verbindung benötigt ja ressourcen, auch wenn sie nich nicht zur Applikation durchgestellt werden kann.