Datamuseum.dk oplever et massivt misbrug fra kinesiske AI-bots, der forsøger at høste data. Artiklen undersøger mønstrene i misbruget, de involverede IP-adresser og de mulige årsager bag disse angreb, herunder brugen af apps og overholdelsen af GDPR. Analysen dykker ned i implikationerne for digital suverænitet og behovet for kritisk journalistik.
Datamuseum.dk er ikke en af verdens mest besøgte hjemmesider, langt fra det, men vi arbejder ihærdigt på at gøre en stor mængde data tilgængelige. Vi er i gang med, støt og roligt, at opbygge den definitive kilde til den danske IT-historie, og det inkluderer selv de mest obskure hjørner, som for eksempel SAS's historie. Vores mål er at bevare og formidle viden om den digitale udvikling i Danmark, og det kræver en konstant indsats for at sikre, at vigtige historiske data ikke går tabt.
Den indsats er en langsommelig proces, men vi ser det som afgørende for at forstå nutiden og forme fremtiden inden for IT.\Som det er blevet nævnt i tidligere indlæg, har vi oplevet et massivt misbrug fra kinesiske AI-bots, der er langt mere aggressive end traditionelle søgemaskiners botter. Disse AI-bots er utroligt ressourcekrævende, de udnytter søgefunktioner på en måde, der er langt fra økonomisk. De benytter sig af alle indstillinger i søgefunktionerne, hvilket resulterer i et enormt antal forespørgsler, der belaster vores databaser. Oprindeligt blokerede vi IP-adresser fra Kina, men det viste sig at være utilstrækkeligt. Senere dukkede trafikken op fra det, vi nedladende kalder 'den 3. verden', med samme mønster: én forespørgsel fra en IP-adresse og derefter stilhed i lange perioder. Vores blokeringsscript nåede op på over 8000 blokerede BGP-routere, før vi måtte ændre strategi. Undersøgelser har vist, at disse IP-adresser ikke var ubrugte, men aktive ranges, primært fra mobiltelefoni. Arbejdshypotesen er, at en populær kinesisk app udnytter en formulering i deres Terms & Conditions til at indsamle data. Vi formoder, at de laver disse testforbindelser for at høste rå data til træning af en AI-model. Trafikken korrelerer med antallet af kinesere i de forskellige lande, med den undtagelse at vi havde overset Kinas tilstedeværelse i Irak efter USA's tilbagetrækning. Der ses ingen trafik fra EU-lande, lidt trafik fra Rusland, mindre fra USA og enkelte forespørgsler fra StarLink.\Den manglende trafik fra EU-lande er sandsynligvis ikke en tilfældighed. Den afspejler den geopolitiske situation og overholdelsen af GDPR. AI-industrien har svært ved at skaffe data, og det er en anerkendelse af, at det er blevet svært at høste data mange steder. Det er afgørende for det digitale landskab at sikre adgang til information, og det er vigtigt at beskytte den digitale suverænitet og selvbestemmelse. Der er behov for kritisk journalistik og en vagthund, der råber op, når der tages forkerte IT-beslutninger. Vi er afhængige af abonnenter for at kunne fortsætte dette arbejde. Ideer om at vise 'kinafjendtligt' indhold for at afskrække AI-bots er risikable, da det kan føre til DDoS-angreb. Der er også bekymringer omkring biblioteker til 'monetisering af browser extensions', som kan bruges til at udnytte brugeres båndbredde og computing ressourcer til kommercielle formål. Det er ironisk at AI-industrien tilsyneladende har så svært ved at få adgang til internettet, at de må ty til forskellige metoder. Mellowtel og lignende systemer positionerer sig som en måde at adressere 'public web access needs within the artificial intelligence industry'
AI-Bots Datamuseum.Dk Kina IT-Sikkerhed GDPR Digital Suverænitet
United States Latest News, United States Headlines
Similar News:You can also read news stories similar to this one that we have collected from other news sources.
Datamuseum.dk: Udvikling i trafik og blokering af skadelige botsDatamuseum.dk oplever en ændring i trafikmønsteret med fokus på skadelig trafik fra AI-bots, hvor blokering af IP-adresser fører til en ny bølge af trafik fra 'den 3. verden'. Bloggen diskuterer den pågående kamp mod bots og den sandsynlige kilde til den skadelige trafik.
Read more »
Kinesiske AI-bots misbruger Datamuseum.dk: Udnyttelse af data fra den 'tredje verden'Datamuseum.dk oplever et massivt misbrug af AI-bots, der indsamler data i stor stil, især fra den 'tredje verden'. Blogindlægget undersøger årsagerne og potentielle implikationer af denne aktivitet, herunder mulige koblinger til kinesiske apps og dataindsamling til AI-træning.
Read more »
Kinesiske AI-bots og misbrug af data: En trussel mod digital suverænitetEn dybdegående analyse af datamuseum.dk's kamp mod aggressive AI-bots, der misbruger data til træning af AI-modeller, og de bredere implikationer for digital suverænitet og beskyttelse af personlige data.
Read more »
AI-bots, Kina og Datamuseum.dk: Kampen mod uønsket trafikDatamuseum.dk oplever stigende trafik fra AI-drevne bots, der udnytter ressourcer. Artiklen undersøger oprindelsen af denne trafik, der primært stammer fra Kina og 'den 3. verden', og spekulerer i brugen af data til AI-træning. Samtidig diskuteres strategier for at bekæmpe denne form for misbrug, herunder brugen af blokering og en potentiel forbindelse til GDPR-overholdelse.
Read more »
Datamuseum.dk: Udfordringer med AI-bots og trafikmisbrugDatamuseum.dk oplever stigende trafik fra AI-bots, især fra Kina og nu fra 'den 3. verden', der misbruger ressourcer ved at udnytte søgefunktioner. Forfatteren har blokeret et stort antal IP-adresser og skifter nu strategi for at håndtere problemet.
Read more »
Datamuseum.dk: Udviklingen i trafik og blokering af AI-botsDatamuseum.dk oplever en voldsom stigning i trafik fra AI-bots, der misbruger ressourcer. Forfatteren deler sine erfaringer med blokering og spekulerer i årsagerne bag den stigende trafik, herunder mulige koblinger til kinesiske apps og dataindsamling.
Read more »
