Linuxgarage.ch

2024-09-19

Opfer der AI: Wordfreq ist eine Python-Lib, um die Häufigkeiten von Wörtern zu bestimmen. Deren Autor wirft nun hin. Hintergrund ist, dass sich diese Library auf gesammelte Texte aus öffentlichen Quellen stützt, und diese zunehmend durch den Output von LLM-Sprachmodellen "verseucht" werden bzw. nicht mehr authentisch bzw. von Menschen produziert sind. Der Frust des Autors über die Situation ist verständlich.

Auch lesenswert der referenzierte Beitrag, wo es darum geht, wie ChatGPT gewisse Wörter und Phrasen übermässig häufig verwendet (z.B. das Wort "delve"). Diese Wörter tauchen merkwürdigerweise plötzlich übermässig oft in diversen wissenschaftlichen Publikationen auf, was nahelegt, dass diese Dokumente durch ChatGPT "überarbeitet" wurden. Höchst bedenklich.