Hallo Meine Geehrten Kollegen ;-)
Hier eine Einleitung für den Hintergrund - Wers eilig hat bitte nach unten zur Fetten Überschrift springen ;-)
Hier mal ein etwas.. sagen wir.. weniger explizit programmatisches Problem
Ich schreibe derzeit für mein Unternehmen ein Maven 3 Plugin zur License Compliance welches folgendes macht:
Es löst die Abhängigkeiten eines Maven projekts während dem builds auf, versucht die verschiedenen Lizenzen der einzelnen Artefakte festzustellen, und gibt 'validiert' die lizenzen anschließend gegen die Infomation eines Dokuments (xml) welches die lizenzen in verschiedene Kategorien einteilt.
Kenner von Maven builds werden nun sagen "das gibt es schon" - da stimme ich euch zu - Es gibt bereits das "license-verifier" plugin von soebes.com, allerdings hat dieses plugin diverse Features nicht die wir brauchen.
Das Hauptfeature welches mein Plugin bietet ist einfache Erweiterbarkeit. So werden beispielsweise anstatt ausschließlich die lizenzen aus den POM files der verschiedenen Projekte zu entnehmen habe werden bei meinem Plugin potenziell mehrere Datenquellen nacheinander zur Rate gezogen um die Lizenzen festzustellen.
Nun für die tapferen, die es geschafft haben sich durch die Einleitung zu kämpfen (oder Sie übersprugen haben ^^) hier das Problem ;-):
Als eine der Quellen war (von meinen Vorgesetzten) aus die seite olex.openlogic.com genannt worden. Damals hies es, die Seite würde eine API zum zugriff auf die zugrundeliegende Datenbank anbieten - Was nicht der fall ist.
Daraufhin wollte ich via HTTP request die HTML antworten parsen. Das Problem hierbei: die Seite lädt.. sagen wir mal gelinde.. EXTREM viel dynamisch via javascript nach.. Habe mich bisher nie wirklich viel parsing von Webseiten beschäftigt und wollte fragen ob mir jemand helfen kann, eine methode zu finden festzustellen wie jetzt wenigstens der interessante content geladen wird, bzw mit was für einem aufruf ich zu diesem komme.
Alternativ wäre auch eine Möglichkeit einen anderen Webservice zu wählen, der mehr für Programmatische Bearbeitung geeignet ist. Ich habe ehrlich gesagt, dass gefühl, dass OpenLogic die OLEX Page bewusst ungeeignet designed hat.
Ich habe auch bereits versucht mit OpenLogic in Kontakt zu treten und einfach mal nachzufragen ob es Teil ihres Geschäftsmodell ist, oder ob man mir helfen kann. Leider kann ich als einzige Antwort bis jetzt Spam verzeichnen.
Hier eine Einleitung für den Hintergrund - Wers eilig hat bitte nach unten zur Fetten Überschrift springen ;-)
Hier mal ein etwas.. sagen wir.. weniger explizit programmatisches Problem
Ich schreibe derzeit für mein Unternehmen ein Maven 3 Plugin zur License Compliance welches folgendes macht:
Es löst die Abhängigkeiten eines Maven projekts während dem builds auf, versucht die verschiedenen Lizenzen der einzelnen Artefakte festzustellen, und gibt 'validiert' die lizenzen anschließend gegen die Infomation eines Dokuments (xml) welches die lizenzen in verschiedene Kategorien einteilt.
Kenner von Maven builds werden nun sagen "das gibt es schon" - da stimme ich euch zu - Es gibt bereits das "license-verifier" plugin von soebes.com, allerdings hat dieses plugin diverse Features nicht die wir brauchen.
Das Hauptfeature welches mein Plugin bietet ist einfache Erweiterbarkeit. So werden beispielsweise anstatt ausschließlich die lizenzen aus den POM files der verschiedenen Projekte zu entnehmen habe werden bei meinem Plugin potenziell mehrere Datenquellen nacheinander zur Rate gezogen um die Lizenzen festzustellen.
Nun für die tapferen, die es geschafft haben sich durch die Einleitung zu kämpfen (oder Sie übersprugen haben ^^) hier das Problem ;-):
Als eine der Quellen war (von meinen Vorgesetzten) aus die seite olex.openlogic.com genannt worden. Damals hies es, die Seite würde eine API zum zugriff auf die zugrundeliegende Datenbank anbieten - Was nicht der fall ist.
Daraufhin wollte ich via HTTP request die HTML antworten parsen. Das Problem hierbei: die Seite lädt.. sagen wir mal gelinde.. EXTREM viel dynamisch via javascript nach.. Habe mich bisher nie wirklich viel parsing von Webseiten beschäftigt und wollte fragen ob mir jemand helfen kann, eine methode zu finden festzustellen wie jetzt wenigstens der interessante content geladen wird, bzw mit was für einem aufruf ich zu diesem komme.
Alternativ wäre auch eine Möglichkeit einen anderen Webservice zu wählen, der mehr für Programmatische Bearbeitung geeignet ist. Ich habe ehrlich gesagt, dass gefühl, dass OpenLogic die OLEX Page bewusst ungeeignet designed hat.
Ich habe auch bereits versucht mit OpenLogic in Kontakt zu treten und einfach mal nachzufragen ob es Teil ihres Geschäftsmodell ist, oder ob man mir helfen kann. Leider kann ich als einzige Antwort bis jetzt Spam verzeichnen.
Zuletzt bearbeitet: