API und DB auf jeweils eigenen Maschinen realistischer Größe bei AWS deployen
möglichst realistische Load-pattern für die Nutzung Ihrer API bestimmen
Ein (sofern so etwas existiert) Benchmarking Tool auswählen oder einen eigenen Benchmarking-Client implementieren, der diese Load ausführen kann
Von einer anderen AWS-Maschine, die mindestens in einer anderen availability zone steht, den Benchmark laufen lassen (mit und ohne extension)
Dabei gewährleisten, dass sie wirklich das messen, was sie messen wollen und nicht etwa zB die Performance der Datenbank. Bottleneck muss die API-Maschine sein. Das lässt sich zB dadurch erreichen, dass die API-Maschine nicht allzu groß ist (wir nehmen für so etwas gern medium-Instanzen) und dass der Client bewusst etwas oversized wird. Beim Benchmarking sollten Sie auch auf allen Maschinen auf CPU/IO/Netzwerk-Auslastung schauen, damit nicht am Ende doch etwas ganz anderes der limitierende Faktor ist. Ich würde erwarten, dass allein die CPU-Load der API-Machine bei 90% liegen wird.