Viele Experten, Firmen und Vereine stellen ihr wertvolles Wissen (Texte, Datenbanken, Bilder) ins Internet und sollten es nicht ungeschützt KI-Bots zum Fraß vorwerfen.
// Wie kann man sich schützen, damit Ihre einzigartigen Werke nicht zu Trainingszwecken für KI’s mißbraucht werden?
// Wie kann man verhindern, dass Suchmaschinen mittels KI-Bots ihr Wissen in Zero-Klicks-Results anbietet und so nicht einmal Besucher mehr generiert?
KI-Systeme werden mit großen Datenmengen trainiert, oft auch urheberrechtlich geschützten Werken. Dank der Urheberrechtsreform 2021 erlaubt das Text und Data Minin (§ 44 UrhG) die Nutzung solcher Werke für KI-Training ohne Zustimmung der Urheber. Um dies zu verhindern, können Urheber einen maschinell lesbaren Nutzungsvorbehalt einfügen, zum Beispiel im Impressum ihrer Website, damit Crawler ihre Inhalte nicht für Trainingszwecke verwenden.
So könnten die Lösungen für Blogs, Webseiten, Portale etc. aussehen: (ohne Gewähr)
A. Für das Impressum:
„Die Nutzung der auf dieser Webseite bereitgestellten Inhalte für Text- und Data-Mining, insbesondere für das Training von KI-Systemen, ist ohne vorherige schriftliche Zustimmung untersagt.“
Dieser Texthinweis sollte im Impressum ergänzt werden.
B. Für Crawler im Head: <meta name="robots" content="noai">
>> Dieser Ansatz blockiert explizit das Training von KI-Systemen, ohne Google und andere Suchmaschinen daran zu hindern, die Seite zu indizieren. Dies setzt jedoch voraus, dass KI-Crawler diese Hinweise respektieren.
C. Mit einer robots.txt DateiUser-agent: GPTBot
Disallow: /
User-agent: Google-Extended
Disallow: /
User-agent: CCBot
Disallow: /
User-agent: anthropic-ai
Disallow: /
User-agent: Applebot
Disallow: /
User-agent: FacebookBot
Disallow: /
User-agent: Gemini
Disallow: /
User-agent: Amazonbot
Disallow: /
>> Mit dieser Anweisung wird dem Crawler eines bestimmten KI-Systems, z. B. GPTBot, der Zugriff auf Ihre gesamte Website untersagt. Beachten Sie, dass diese Anweisung nicht das Training mit bereits kopierten Daten verhindern kann, sondern nur zukünftige Zugriffe unterbindet.
D. Cloudflare – Hoster schützt ihre Webseite und sperren KI-BOTS ausSeit Sommer 2025 werden Kunden-Webseites vor dem
Zugrif
f
KI-Bots geschützt. Ca. 20 % des Internet ist so geschützt.von
Das ist Cloudflare und diese Leistungen werden geboten
Highlights zum Thema:
- Urheberrecht: KI-generierte Inhalte sind nicht urheberrechtlich geschützt, da nur Menschen Urheber sein können.
- Nutzung: Sie können frei genutzt werden, aber Nutzer haften für rechtliche Verstöße, z. B. Ähnlichkeiten mit geschützten Werken.
- Kennzeichnung: Eine Kennzeichnungspflicht besteht nur in bestimmten Fällen, z. B. für Social Media oder Deep Fakes.
- Urheberschaft: Änderungen an KI-Inhalten müssen signifikant sein, um als Urheber zu gelten.
- Kommerzielle Nutzung: Erlaubt, solange die Nutzungsbedingungen der KI-Plattform beachtet werden.
- Verträge: KI-Nutzung in Kundenaufträgen erfordert klare Regelungen zur Haftung und Nutzungsrechten.
Etwas ausführlicher:
- KI-generierte Inhalte: Mit KI-Tools wie ChatGPT, DALL-E oder Midjourney können Texte, Bilder, Logos und mehr erstellt werden. Diese basieren auf maschinellem Lernen, das mit urheberrechtlich geschützten Daten trainiert wurde.
- Urheberrecht von KI-Inhalten: Die Frage, wer der Urheber von KI-generierten Inhalten ist, ist entscheidend. Nach deutschem Urheberrecht können nur Menschen Urheber sein. Weder die KI selbst noch ihre Entwickler oder Nutzer gelten als Urheber. Somit sind KI-generierte Inhalte urheberrechtlich nicht geschützt und gelten als gemeinfrei.
- Folgen der Nutzung von KI-Inhalten: Da KI-Inhalte keinen Urheberrechtsschutz genießen, dürfen sie frei verwendet werden, ohne Lizenzgebühren oder Namensnennung. Nutzer haften jedoch für die Verwendung und mögliche Rechtsverletzungen, z. B. durch Ähnlichkeiten mit geschützten Werken.
- Risiken: KI-Inhalte können anderen Werken ähneln, was rechtliche Konsequenzen haben kann. Zudem besteht das Risiko, dass andere Nutzer den gleichen Prompt eingeben und identische Inhalte erhalten.
- Kennzeichnungspflicht: Eine generelle Kennzeichnungspflicht für KI-Inhalte gibt es nicht. Für Social Media und spezielle Anwendungen (wie Deep Fakes oder öffentliche Angelegenheiten) gelten jedoch bereits Kennzeichnungsvorschriften.
- Urheber von KI-generierten Inhalten werden: Nutzer können durch signifikante Änderungen an KI-Inhalten Urheberrechte erwerben, aber einfache Modifikationen reichen dafür nicht aus. Die individuelle kreative Leistung ist entscheidend.
- Kommerzielle Nutzung: KI-generierte Inhalte können grundsätzlich kommerziell verwendet werden. Es sollte jedoch sichergestellt werden, dass die Nutzungsbedingungen der jeweiligen KI-Plattform eingehalten werden.
- Verträge und Haftung: Wenn KI-Inhalte für Kunden erstellt werden, kann es zu Problemen kommen, da keine Nutzungsrechte übertragen werden können. Haftungsfragen sollten vertraglich geklärt werden.
Mehr Infos zu diesem Thema finden Sie in einem Artikel bei www.erecht24.de
1 Kommentar
Kommentieren →Wichtige Hinweise
Nicht alle Bots halten sich an robots.txt: Besonders unbekannte oder bösartige Bots ignorieren die Datei oft.
Weitere Schutzmaßnahmen: Für mehr Sicherheit kannst du serverseitige Maßnahmen wie IP-Blocking oder HTTP-Authentifizierung einsetzen.
Regelmäßige Aktualisierung: Die Liste der KI-Bots wächst ständig. Halte deine robots.txt aktuell.
Hier ein Beispiel, wie du die wichtigsten bekannten KI-Bots blockierst:
User-agent: GPTBot
Disallow: /
User-agent: Google-Extended
Disallow: /
User-agent: CCBot
Disallow: /
User-agent: anthropic-ai
Disallow: /
User-agent: Applebot
Disallow: /
User-agent: FacebookBot
Disallow: /
User-agent: Gemini
Disallow: /
User-agent: Amazonbot
Disallow: /