Eine neue Studie warnt vor gravierenden Datenschutzrisiken in offenen KI-Datensätzen. Im DataComp CommonPool, einer der größten Sammlungen für das Training von Bildgeneratoren, fanden Forschende Millionen hochsensibler Dateien. Die Erkenntnisse verdeutlichen, wie unkontrolliertes Web-Scraping private Informationen in KI-Systeme einspeist – und wie schwer sich diese später wieder entfernen lassen.