Jump to content

  • Is Dit de Grootste Toekomstige Strijd voor Stichting Brein: De Oorlog tegen Illegale AI-Datasets?

     Share


    Het bestrijden van het gebruik van illegale datasets voor het trainen van AI modellen is een complexe en uitdagende taak. De afgelopen tijd heeft Stichting Brein bijvoorbeeld een grote Nederlandse dataset offline gehaald, die bestond uit boeken, nieuwsartikelen van websites zoals Nu.nl, en ondertitels van films en tv-series uit illegale bronnen. Dit is een duidelijke stap in de strijd tegen het misbruik van auteursrechtelijk beschermd materiaal, maar maar is het ook mogelijk om grip te krijgen op dit probleem?

    Makkelijk aan data te komen

    Informatie die online beschikbaar is, zoals nieuwsartikelen, ondertitels en zelfs openbare kunstwerken, is vaak slechts een paar klikken verwijderd. Voor AI ontwikkelaars die hun modellen willen trainen, is het technisch gezien relatief eenvoudig om grote hoeveelheden data te verzamelen via technieken zoals webscraping. Dit maakt het erg verleidelijk om deze data te gebruiken, zelfs als dat niet legaal is. Veel mensen realiseren zich niet dat het kopiëren van deze informatie een inbreuk op auteursrechten is, of ze denken dat de kans dat ze gepakt worden klein is.

    Moeilijk om op te sporen

    Zelfs als een illegale dataset wordt ontdekt en offline gehaald, zoals Stichting Brein recentelijk heeft gedaan, blijft het lastig om de verspreiding ervan volledig te stoppen. Data kan snel opnieuw worden gedeeld via andere kanalen of worden opgeslagen op locaties buiten het bereik van nationale wetgeving. Daarnaast is het moeilijk om te achterhalen wie de dataset allemaal heeft gedownload en gebruikt. Dit maakt de handhaving van auteursrechten erg ingewikkeld, zeker als de data al in verschillende AI modellen is verwerkt.

    Snel veranderende technologie

    De technologie rond AI ontwikkelt zich sneller dan ooit. Nieuwe methoden en technieken voor het verzamelen en verwerken van data worden continu ontwikkeld, wat het voor wet en regelgeving lastig maakt om bij te blijven. Terwijl de technologie vooruit dendert, blijven juridische kaders vaak achter. Dit zorgt ervoor dat degenen die zich niet aan de regels houden vaak een technologische voorsprong hebben, en dat maakt het moeilijker om hen op verantwoording te roepen.

    Wereldwijd probleem

    Het internet kent geen grenzen, en dat maakt de handhaving van auteursrechten extra lastig. Een dataset die in Nederland illegaal wordt bevonden, kan eenvoudig naar servers in een ander land worden verplaatst, waar de regels misschien minder streng zijn. Internationale samenwerking is daarom cruciaal, maar dit is vaak complex en traag. Bovendien zijn de juridische systemen en handhavingscapaciteiten per land verschillend, wat het moeilijk maakt om wereldwijd dezelfde normen toe te passen.

    Gebrek aan bewustzijn

    Veel AI ontwikkelaars zijn zich niet volledig bewust van de juridische en ethische implicaties van het gebruik van bepaalde datasets. Onderzoeken, zoals die van de NOS, hebben aangetoond dat werken van Nederlandse beeldmakers zonder hun toestemming zijn gebruikt voor het trainen van bekende AI afbeeldinggeneratoren zoals DALL-E en Midjourney. Dit gebrek aan bewustzijn kan deels worden verklaard door de complexiteit van de technologie en de snelheid waarmee deze zich ontwikkelt, maar het toont ook aan dat er meer gedaan moet worden om ontwikkelaars en bedrijven bewust te maken van de risico's en verantwoordelijkheden.

    Conclusie

    De acties van Stichting Brein laten zien dat er stappen worden gezet om het probleem aan te pakken, maar het blijft een grote uitdaging. De combinatie van makkelijk toegankelijke data, de moeilijkheid van handhaving, de snel veranderende technologie, de internationale dimensie van het probleem, en het gebrek aan bewustzijn onder AI ontwikkelaars maken dit een uiterst complexe kwestie. Om echt vooruitgang te boeken, zal een breed scala aan maatregelen nodig zijn, variërend van technologische innovaties en strengere handhaving tot meer samenwerking en bewustwordingscampagnes. Het is duidelijk dat dit geen probleem is dat eenvoudig kan worden opgelost, maar elke stap in de goede richting helpt om de impact te verminderen.

    Door William,

     



    William
    • Agree 1
     Share


    User Feedback

    Recommended Comments

    • Content-manage

    De AI-Dataset die door BREIN offline is gehaald was gericht op het ondersteunen van AI computermodellen en in het bijzonder voor zogenaamde large language models (LLMs). Er zitten grote verschillen in de door AI gebruikte datasets en is ook volledig afhankelijk van het doel van de gegenereerde content. Hieronder een korte opgave van de verschillen waar we op dit moment mee te maken hebben als consument.

    Het gebruik van AI-datasets verschilt aanzienlijk op basis van het uiteindelijke doel, namelijk persoonlijk gebruik of algemeen openbaar gebruik, vooral in de context van grote taalmodellen (LLMs). Hier is een korte uitleg van de verschillen:

    ### AI-datasets voor Persoonlijk Gebruik:
    1. **Doel**: De datasets worden gebruikt om modellen te trainen die gepersonaliseerde content genereren voor individueel gebruik. Dit kan bijvoorbeeld zijn voor persoonlijke projecten, hobby's, zelfstudie of entertainment.
    2. **Dataset Samenstelling**: De datasets kunnen bestaan uit persoonlijke notities, e-mails, privé-documenten, of andere persoonlijke gegevens die relevant zijn voor de gebruiker.
    3. **Privacy en Veiligheid**: Aangezien de data vaak persoonlijk en gevoelig kan zijn, is privacy een belangrijke overweging. Er moeten adequate maatregelen worden genomen om ervoor te zorgen dat de data niet wordt gelekt of misbruikt.
    4. **Nauwkeurigheid en Validatie**: De focus ligt op het genereren van content die nuttig en relevant is voor de gebruiker. De nauwkeurigheid en validatie van de output kunnen minder streng zijn omdat er geen brede consequenties zijn voor het publieke domein.

    ### AI-datasets voor Algemeen Openbaar Gebruik:
    1. **Doel**: De datasets worden gebruikt om modellen te trainen die content genereren voor een breed publiek. Dit omvat nieuwsartikelen, openbare blogs, wetenschappelijke stukken, en andere vormen van massacommunicatie.
    2. **Dataset Samenstelling**: Deze datasets zijn vaak samengesteld uit breed toegankelijke en geverifieerde bronnen zoals encyclopedieën, officiële rapporten, wetenschappelijke papers, en gecontroleerde nieuwswebsites.
    3. **Privacy en Veiligheid**: Aangezien de output voor het grote publiek is, moeten deze datasets voldoen aan strenge privacywetten en ethische richtlijnen om ervoor te zorgen dat geen persoonlijke of misleidende informatie wordt verspreid.
    4. **Nauwkeurigheid en Validatie**: Er zijn hoge standaarden voor de accuraatheid en betrouwbaarheid van de gegenereerde content omdat foutieve informatie kan leiden tot verkeerde beslissingen of publieke misleiding. Vaak wordt er een strikter validatieproces toegepast om de waarheidsgetrouwheid van de artikelen te waarborgen.

    ### Specifieke Overwegingen voor Gedeeltelijk Waarheidsbewuste Artikelen:
    - **Bronverificatie**: Voor datasets die gedeeltelijk waarheidsbewuste artikelen bevatten, is het cruciaal om de bronnen en de integriteit van de informatie streng te controleren.
    - **Bias en Ethiek**: Het gebruik van dergelijke datasets moet zorgvuldig worden gemonitord om bias te minimaliseren en te voorkomen dat foutieve of misleidende informatie wijdverspreid wordt.

    Samenvattend, het verschil tussen AI datasets voor persoonlijk en algemeen openbaar gebruik ligt voornamelijk in hun doelstelling, de samenstelling van de datasets, privacy- en veiligheidsmaatregelen, en de mate van nauwkeurigheid en validatie die vereist is voor de gegenereerde content.

    Link to comment
    Share on other sites



    Join the conversation

    You can post now and register later. If you have an account, sign in now to post with your account.
    Note: Your post will require moderator approval before it will be visible.

    Guest
    Add a comment...

    ×   Pasted as rich text.   Paste as plain text instead

      Only 75 emoji are allowed.

    ×   Your link has been automatically embedded.   Display as a link instead

    ×   Your previous content has been restored.   Clear editor

    ×   You cannot paste images directly. Upload or insert images from URL.


Announcements

  • Nieuwe handleiding

  • Latest nieuws

  • Willekeurig topic

  • Nu op het forum

    Eater

    Posted

    Yudhra 20 september 2024 Yudhra is een elbelovende Indiase actiefilm in het Hindi, geregisseerd door de getalenteerde Ravi Udyawar. Het script is geschreven door Shridhar Raghavan, met sprankelende dialogen van Farhan Akhtar en Akshat Ghildial. Geproduceerd door Farhan Akhtar en Ritesh Sidhwani onder het vlag van Excel Entertainment, belooft deze film een adembenemende mix van actie, romantiek en drama. Met een indrukwekkende cast, waaronder Siddhant Chaturvedi, Malavika Mohanan en Gajraj Rao, zal Yudhra je meenemen op een inspirerende reis vol emotie en spanning. Bereid je voor op een onvergetelijke ervaring!. --------------------------------------------------------------------------------------------- Hanna en de Monstervriendjes 25 september 2024 Kan een vierjarig meisje werkelijk een stad vol monsters op zijn kop zetten? De jonge Hanna stuit 's nachts op een monster genaamd Coco in haar kamer en besluit hem te volgen naar  Monsterville. Bij haar aankomst slaat de paniek toe: als ze niet op tijd terugkeert, dreigt ze voor eeuwig in deze vreemde wereld gevangen te blijven, terwijl de mensen naar haar op zoek gaan. Een avontuur vol spanning en onverwachte wendingen wacht op haar, maar kan ze de weg naar huis vinden voordat het te laat is? -----------------------------------------------------------------------------------------------------------      Transformers One 19 september 2024 Het onvertelde verhaal van Optimus Prime en Megatron, ooit broeders in de strijd, nu gezworen vijanden, onthult een diepere verbinding die de toekomst van Cybertron voorgoed heeft veranderd. De oppervlakte van deze mysterieuze planeet is een gevaarlijke wereld, waar jonge transformers niet welkom zijn. Onder de aardkorst genieten Orion Pax en D-16, die nog niet kunnen transformeren, van een zekere vrijheid en dragen ze bij aan hun gemeenschap. Wanneer ze echter de verboden wereld boven hen betreden, worden ze geconfronteerd met wonderlijke, gemechaniseerde wezens en plantachtige levensvormen. Hun bestaan krijgt een nieuwe wending wanneer ze Alpha Trion ontmoeten, die hen de kracht van transformatie leert. Deze ontmoeting markeert het begin van een epische reis, waarin vriendschap en rivaliteit hand in hand gaan, en de toekomst van Cybertron op het spel staat. --------------------------------------------------------------------------------------- The Substance 19 september 2024  Een vervagende beroemdheid besluit haar geluk te zoeken in een zwart-markt drug: een cel-replicerende substantie die tijdelijk een jongere, betere versie van zichzelf creëert. Met deze innovatieve stof komt een revolutionair product op de markt, waarmee mensen de kans krijgen om op elk vlak van hun leven te verbeteren. Het biedt de mogelijkheid om niet alleen jonger, maar ook mooier te zijn. Echter, er is een prijs te betalen: je moet je tijd verdelen tussen de twee versies van jezelf; een week voor de ene, een week voor de andere. Zolang je dit delicate evenwicht respecteert, lijkt alles mogelijk. Maar is het echt zo eenvoudig? De vraag rijst of het najagen van perfectie niet ook zijn schaduwzijde  heeft. In de zoektocht naar een betere versie van jezelf, wat ben je bereid op te offeren? ---------------------------------------------------------------------------------------------------------   Führer und Verführer 19 september 2024 In "FÜHRER UND VERFÜHRER" worden de schaduwrijke dagen vanJoseph Goebbels, de propagandaminister van de nazi's, onthuld. Na de nederlaag bij Stalingrad probeert hij wanhopig de publieke steun vast te houden, terwijl de wereld om hem heen instort. In de duistere diepten van Hitlers bunker, waar wanhoop en verraad heersen, neemt hij een ondenkbare beslissing: de moord op zijn eigen kinderen, gevolgd door zijn zelfdoding met zijn vrouw.   ----------------------------------------------------------------------------------------------------- La Bella Estate (2023) 19 september 2024 Ginia, zeventien jaar oud, bevindt zich op een wervelwind van gevoelens die de overgang naar volwassenheid zo kenmerkt. De ontmoeting met Amelia brengt een golf van nieuwe en soms schokkende emoties met zich mee, waardoor Ginia gedwongen wordt om haar diepste verlangens onder ogen te zien. In deze ontdekkingstocht naar zichzelf voelt ze de vreugde en de chaos van het leven. Het is pas wanneer ze deze bijzondere liefde durft te erkennen, dat ze de vrijheid vindt om echt zichzelf te zijn. De weg naar volwassenheid is niet altijd eenvoudig, maar met elke stap leert Ginia dat het omarmen van haar gevoelens de sleutel is tot haar eigen identiteit. Zo groeit ze niet alleen in liefde, maar ook in zelfvertrouwen, terwijl ze de rijke kleuren van haar emoties omarmt.      

    Eater

    Posted

    @Adobenjer je kunt ook in telegramgroupen zoeken en vinden.

    Eater

    Posted

    Nightsleeper Zondag 15-09-2024 BBC 1 6 afleveringen Stap aan boord van een razendsnelle thriller die voortkomt uit dezelfde creatieve geest als de vlotte ITV1-serie Red Eye en het stijlvolle Apple TV+ avontuur Hijack. Deze keer geen luchtvaartperikelen, maar een nachttrein van Glasgow naar Londen Euston, waar passagier en politieagent Joe (Joe Cole) in een angstaanjagende situatie verzeild raakt. Zonder wifi of telefoonsignaal en met een ontsporende spoorweg, lijkt dit een dagelijkse pendelrit. Maar als er een verdachte constructie wordt ontdekt en de trein uit controle raakt, schakelt Joe via een satelliettelefoon cyberbeveiligingsexpert Abby (Alexandra Roach) in. Kan zij de ontvoerder ontmaskeren en de trein vóór een catastrofe stoppen? Met een onwaarschijnlijke vertraging van slechts acht minuten en een team dat het hoofd boven water probeert te houden, belooft deze serie een spannende rit te worden! ------------------------------------------------------------------------------------------------------------------------------------------------ The Wives Maandag 16-09-2024 Channel 5 6 afleveringen De gebroeders Morgan zijn teruggekeerd naar Engeland om de financiële problemen van hun bedrijf op te lossen, waarvan Charlie beweert dat ze zijn overleden vrouw Annabelle de schuldige is. Geloven we hem? Ik denk het niet, maar zijn broers wel. Ondertussen blijven Beth, Tash en Sylvie als in een EastEnders-scène wijn drinken en elkaar toeschreeuwen, om vervolgens weer te verzoenen. Vermoeiend, maar ze vinden tijd om Charlie's jonge vriendin Jade grondig te ondervragen, wat onthult hoe onbetrouwbaar hun zwager werkelijk is. En Luca? Die blijkt meer te zijn dan enkel Sylvie's aantrekkelijke Maltese date. Na een jaar sinds Annabelle's verdwijning in Malta, komt de familie samen om het verleden te verwerken. Maar wanneer Annabelle's man met een nieuwe partner arriveert, besluiten de Morgan-vrouwen zelf op onderzoek uit te gaan. Achter de façade van luxe schuilen talloze geheimen, en Beths ontdekkingen maken haar steeds wantrouwiger tegenover Charlie. De drie zussen-in-law zijn geen Sherlock Holmes, maar ze zijn vastberaden om de waarheid te vinden. ----------------------------------------------------------------------------------------------------------------------------------------------- A Very Royal Scandal Dinsdag 17-09-2024 Amazon Prime 3 Afleveringen Laat je niet misleiden door de gelijkenis met Scoop op Netflix,dat enkele maanden geleden hetzelfde verhaal vertelde. Deze dramatische reconstructie van Prins Andrews rampzalige interview op Newsnight in 2019 is afkomstig van de makers van A Very English Scandal en A Very British Scandal. Wat deze serie bijzonder maakt, is de goedkeuring van uitvoerend producent Emily Maitlis.Ruth Wilson schittert als de journaliste en zet Maitlis zo nauwkeurig neer dat het bijna griezelig is. Zelfs tegenover de indrukwekkende acteerprestaties van Michael Sheen als Prins Andrew, weet Wilson de aandacht vast te houden. Het verhaal blijft boeiend: een man, verblind door arrogantie en privilege, onderschat een journalist die een groot verhaal heeft ontdekt. ----------------------------------------------------------------------------------------------------------------- Envious Woensdag 18-09-2024 Netflix 12 afleveringen Vanuit Argentinië komt een sprankelende Spaanse komedie met een scherpzinnige,misantropische ondertoon. Op de vooravond van haar gevreesde veertigste verjaardag stelt Vicky (Griselda Siciliani) haar vriend een ultimatum: trouw met mij of ik ga weg. Maar als hij besluit te trouwen, maar niet met haar, slaat de situatie om. Boos en vol zelfhaat gaat Vicky op zoek naar de liefde, terwijl ze worstelt met haar jaloezie over het ogenschijnlijk perfecte leven van andere vrouwen. Siciliani schittert als de komische hoofdrolspeelster in een serie vol gedurfde observaties.Wanneer haar plannen in duigen vallen, besluit ze haar droom van een huwelijk met een nieuwe partner na te jagen. Dit leidt tot een onverwachte reis van zelfontdekking en groei, waarbij Vicky leert dat liefde niet alleen gaat om de ander, maar ook om zichzelf. -------------------------------------------------------------------------------------------------------------------------------------------- Agatha All Along Donderdag 19-09-2024 Disney+ 9 afleveringen Marvel's nieuwste televisietrip nodigt ons uit terug te keren naar hun allereerste show uit 2021: het eigenaardige en mysterieuze WandaVision. In deze unieke serie bevonden de Avengers Wanda en Vision zich in een bizarre wereld van vintage sitcoms. Nu krijgen we een spin-off van de schimmige heks Agatha Harkness, gespeeld door de onweerstaanbare Kathryn Hahn. In deze serie ontsnapt ze uit haar gevangenis en bundelt ze haar krachten met andere betoveraars om haar verloren magie terug te winnen. Hoewel het misschien wat cliché klinkt, blijft WandaVision de onbetwiste hoogtepunten binnen het Marvel-universum, en Hahn schitterde als de breakout ster. Met haar charisma en talent kan ze ongetwijfeld een nieuwe betovering teweegbrengen. Bereid je voor op een magische reis vol intriges en verrassingen! ----------------------------------------------------------------------------------------------------------------------------------------------- All Creatures Great and Small Donderdag 19-09-2024  Channel 5   6 afleveringen Terwijl James gescheiden is van zijn vrouw Helen en hun kleine zoontje, blijft hij zijn land dienen. Maar aan het begin van deze nieuwe serie staat zijn leven op RAF Abingdon op het punt om wat turbulentie te ondergaan... De feelgood-sfeer ging verloren in de vorige serie, overschaduwd door Tristan's afwezigheid en James's uitzending bij de luchtmacht. Toch, zelfs met de oorlog nog vier jaar weg, gloort er hoop op een gouden terugkeer, vooral omdat acteur Callum Woodhouse zijn geliefde rol als Tris weer oppakt. James blijft op RAF Abingdon, waar een belangrijke training vlucht wacht. Maar een medische keuring zorgt ervoor dat de dierenarts-turned-piloot onverwachts aan de grond blijft. Ondanks de militaire focus, krijgen de dieren niet minder aandacht, met een luchtig subplot rond een kattenverwisseling. Ondertussen worden Tricki Woo en zijn baasje, mevrouw Pumphrey, tijdelijk uit hun statige woning gezet, die wordt omgevormd tot een ziekenhuis voor herstellende soldaten. -------------------------------------------------------------------------------------------------------------------------------------------------- La Maison Vrijdag 20-09-2024 Apple TV+ 10 afleveringen Mode-documentaires en dramas over ontwerpers, van Coco Chanel tot John Galliano, zijn momenteel razend populair. Maar één ontwerper die je waarschijnlijk niet kent, is Vincent Ledu, het hoofd van het fictieve Parijse haute couturehuis LEDU.In de nieuwe drama-serie La Maison op Apple TV+ dreigt Ledu (Lambert Wilson) de ondergang van LEDU te veroorzaken door een virale video die de erfenis van het huis in gevaar brengt. Kostuumontwerper Carine Sarfati, die haar carrière begon als stagiaire bij Ted Lapidus, creëerde in drie maanden tijd vijftig haute couture looks voor de drie modehuizen in de serie. Naast het familiebedrijf LEDU, dat bekendstaat om zijn kant en traditionele waarden, zijn er ook Rovel, een opvallend merk dat zich aanpast aan nieuwe trends, en het milieubewuste, jeugdige Doppel. "Het grootste avontuur was het bouwen van een modehuis dat niet bestaat, maar dat aanvoelt alsof het al een eeuw meegaat," vertelt Sarfati. --------------------------------------------------------------------------------------------------------------------------------------------- The Penguin Vrijdag 20-09-2024 Sky Atlantic en  HBO Max  8 afleveringen Net als in 2022's The Batman verdwijnt acteur Colin Farrell onder een indrukwekkende laag prosthetics om Oswald "Oz" Cobblepot (de Pinguïn) tot leven te brengen. Maar is het Dark Knight-universum ook verdwenen? Na het zien van het eerste uur lijkt het meer op een rechttoe rechtaan maffiasaga dan op een superhelden-spin-off, en dit is zeker geen film voor kinderen. Verwacht actie en taalgebruik die zo rauw zijn als in elke aflevering van The Sopranos,maar met een excentriekere cast, met als meest opvallende figuur de kille psychopaat Sofia Falcone (Cristin Milioti). Dit staat natuurlijk mijlenver van de campy sfeer van de oude Batman-serie, hoewel Oz toevallig boven een juwelierszaak woont, gerund door iemand met de naam Burgess. Een knipoog naar Burgess Meredith, die de waggelende schurk in de jaren '60 speelde?
  • Recente actieve topics

×
×
  • Create New...