[Suche] sinnvolle BadWord-Liste

oldshoe

Bekanntes Mitglied
Hallo,
ich suche eine übersichtliche Liste mit deutschen BadWords, welche speziell antisemitische Wörter aber auch Begriffe wie "Kinderschänder" blacklisted sozusagen. Halt nichts womit Personen aufgrund zweideutiger Kontexte in Verbindung gebracht werden wollen. Schimpfwörter wie "Ar***loch" kommen in meinem Anwendungsfall eigentlich nicht vor. Vielleicht gibts es irgendwo kategorisierte BadWord-Listen?

Ich habe bisschen gegoogelt und z.B. Hyperhero Schimpfwort - Liste mit ca. 7830 Schimpfwoertern gefunden. Aber das würde einfach zuviel filtern, da auch Wörter wie "Abfall" dabei sind.

Weiß da jemand mehr?:rtfm:
 

Atze

Top Contributor
kenne sowas nicht, aber wenn deine liste so "speziell" ist, wirds wohl schwierig eine zu finden, die genau deinen ansprüchen zusagt. vielleicht selber schreiben :)
 

Marco13

Top Contributor
Solange man "sinnvoll" nicht näher definiert, wird das schwierig. Oder um's mal so zu sagen: "'Bitches' are just female dogs"....
 

Landei

Top Contributor
Der Spamfilter unseres amerikanischen Mutterkonzerns hat mal hartnäckig die Stadt Ludwigslust und ähnliches geblockt...
 

faetzminator

Gesperrter Benutzer
Am Besten im Programm eine Funktion implementieren, mit welcher ein Wort einfach blacklisted werden kann. Z.B. durch Rechtsklick aufs Wort -> [Kontextmenu] -> add to blacklist.
 

agentone

Bekanntes Mitglied
Ich würde auch nach der Anzahl solcher Wörter gehen.
Oder z.B. eine Priorität festlegen:
-mehrdeutige Wörter wie "Schwanz" mit geringer Priorität
-eindeutige Wörter wie "Bitch" mit hoher Priorität
Dann summierst du die Prioritäten und schaust, ob die Summe über einem Maximal-Wert liegt.
 

ice-breaker

Top Contributor
Das Problem ist doch einfach, dass viele Wort in verschiedenem Kontext andere Bedeutungen haben. Deswegen lassen sich keine sinnvollen BadWord-Listen definieren.

Ich würde eher soweit gehen und ein TextSegment als gut oder böse (so wie SpamFilter) definieren, denn wenn jemand einen anderen Beleidigen will, werden da bestimmt mehrere BadWords vorhanden sein oder die Semantik wird es zeigen:
Du verdammter *** ich *** dich !!!! *** ***[...]

also ich würde eher in Richtung Textanalyse gehen, gut, eine ganze Ecke schwerer aber lohnender. So eine Filtersoftware lässt sich bestimmt auch gut verkaufen :D
Ansonsten es primitiv mit einem Bayes-Filter umsetzen, der kann dann auch schön mitlernen, wenn man böse Nachrichten findet oder false-positives.

Anmerkung: Es gibt keine vom Autor implizit gedachten Lückenfüller für dieses Zitat, aber ich vermute mal das der Großteil an Beleidigungen linguistisch so aufgebaut sein wird.
 
Zuletzt bearbeitet:
Ähnliche Java Themen
  Titel Forum Antworten Datum
OnDemand Suche Ideen zu Verteilung von Updates Softwareentwicklung 7
M Pseudocode der Exponentiellen Suche Softwareentwicklung 0
S Suche: (Versionierungs)Tool für Klassenaustausch mit Kollegen, die auch an dem Projekt arbeiten Softwareentwicklung 5
J Suche noch eine Loesung fuer Kommunikation zwischen Webserver und ein Programm Softwareentwicklung 0
R Suche Einbinden Softwareentwicklung 12
Gossi Ruby: Suche durch Datein Softwareentwicklung 4
M Rekursive Suche in einem Baum Softwareentwicklung 3
M Suche Task-Software (Groupware mit Anpassungsmöglichkeiten) Softwareentwicklung 3
M Suche das "optimale" Web-Framework... Softwareentwicklung 6
Quaxli Suche Tutorial für Jasper Report - speziell iReport Softwareentwicklung 8
K Suche freies UML Tool um aus .java dateien Diagramme zu. Softwareentwicklung 8
S binaere Suche Verstaendnisproblem Softwareentwicklung 3
G Suche Ajax Javascript library Softwareentwicklung 10
G Suche Programm für Masken Design für Pflichtenheft Softwareentwicklung 5
G Suche UML Aufgaben mit Lösungen zum Übem Softwareentwicklung 2
K Suche nach regulärem Ausdruck Softwareentwicklung 5
T Suche: Informationen über Online Ticketing Softwareentwicklung 4
T Suche A Star Java Beispielprogramm Softwareentwicklung 2
B Suche Latex-Editor Softwareentwicklung 15

Ähnliche Java Themen

Neue Themen


Oben