Hallo zusammen,
vielleicht kann mir ja hier jemand helfen. Wir setzen bei uns Jenkins als CI System in Kombination mit dem Gerrit Code Review Tool ein. Eigentlich laeuft das auch soweit alles super. Wir haben inzwischen 10 Jenkins Slaves, die die Gerrit Patchsets uebersetzen, alle Tests ausfuehren und entsprechende Packete schnueren, die dann auf Wunsch direkt ausgeliefert werden koennen.
In letzter Zeit haeufen sich allerdings sehr seltsame Probleme: Manchmal bleibt der eine oder andre Slave einfach "haengen". Das ist total zufaellig, mal der eine, mal der andre Slave (das sind btw alles virtuelle Maschinen mit einem Ubuntu drauf). Manchmal mitten in irgendwelchen Tests, manchmal erst ganz am Ende, wenn der Build eigentlich schon fertig ist.
Einziger Workaround ist derzeit, den Build abzubrechen und erneut zu starten. Bei einer Buildzeit von ca 45 Minuten ist das natuerlich sehr nervig.
Ich hab jetzt auch schon mehrere Stunden mit Google und dem Jenkins Ticketsystem verbracht, bisher ohne klares Ergebnis. Zwar gibt es etliche Probleme, die irgendwelche Deadlocks verursachen, allerdings sehen unsere Stackdumps deutlich anders aus, als die in den Bugtickets beschriebenen. Zudem sind die meisten davon bereits auf geloest gestellt und wir setzen eine recht aktuelle Jenkins Version ein.
Die Haenger wurden uebrigens richtig schlimm, als wir noch 5 weitere Slaves dazugepackt hatten. Inzwischen sind die neuen wieder deaktiviert, aber die Probleme immer noch da.
Haengt ein oder mehrere Slaves, ist auf den Rechnern (inkl. Master) weder CPU- noch IO Last. Die idlen einfach und offensichtlich warten die auf irgendwas.
Hat hier jemand schon mal aehnliche Probleme oder einen Hinweis, was wir noch ausprobieren koennten?
vielleicht kann mir ja hier jemand helfen. Wir setzen bei uns Jenkins als CI System in Kombination mit dem Gerrit Code Review Tool ein. Eigentlich laeuft das auch soweit alles super. Wir haben inzwischen 10 Jenkins Slaves, die die Gerrit Patchsets uebersetzen, alle Tests ausfuehren und entsprechende Packete schnueren, die dann auf Wunsch direkt ausgeliefert werden koennen.
In letzter Zeit haeufen sich allerdings sehr seltsame Probleme: Manchmal bleibt der eine oder andre Slave einfach "haengen". Das ist total zufaellig, mal der eine, mal der andre Slave (das sind btw alles virtuelle Maschinen mit einem Ubuntu drauf). Manchmal mitten in irgendwelchen Tests, manchmal erst ganz am Ende, wenn der Build eigentlich schon fertig ist.
Einziger Workaround ist derzeit, den Build abzubrechen und erneut zu starten. Bei einer Buildzeit von ca 45 Minuten ist das natuerlich sehr nervig.
Ich hab jetzt auch schon mehrere Stunden mit Google und dem Jenkins Ticketsystem verbracht, bisher ohne klares Ergebnis. Zwar gibt es etliche Probleme, die irgendwelche Deadlocks verursachen, allerdings sehen unsere Stackdumps deutlich anders aus, als die in den Bugtickets beschriebenen. Zudem sind die meisten davon bereits auf geloest gestellt und wir setzen eine recht aktuelle Jenkins Version ein.
Die Haenger wurden uebrigens richtig schlimm, als wir noch 5 weitere Slaves dazugepackt hatten. Inzwischen sind die neuen wieder deaktiviert, aber die Probleme immer noch da.
Haengt ein oder mehrere Slaves, ist auf den Rechnern (inkl. Master) weder CPU- noch IO Last. Die idlen einfach und offensichtlich warten die auf irgendwas.
Hat hier jemand schon mal aehnliche Probleme oder einen Hinweis, was wir noch ausprobieren koennten?