opporsi al training delle AI

Come se nella vita uno non avesse niente da fare, tre le nuove attività che si sono aggiunte per chi vive il mondo digitale con una certa consapevolezza è quella di dover ‘rincorrere’ la varie software house e gruppi tecnologici in modo da cercare di NON contribuire gratuitamente al training dei loro sistemi di “intelligenza artificiale”.

Questi gli ultimi due link / task da eseguire in cui mi sono imbattuto:

Bloccando Bot

Facendo seguito all’articolo di Ethan Marcotte su come poter fare opt-out dalla pesca a strascico dei contenuti web da parte dei vari bot dei servizi di “intelligenza artificiale” sinora conosciuti ho adottato queste due contromisure.
Specifico che il mio CMS per pubblicare online è WordPress, quindi se usi altro, il codice proposto potrebbe essere da adattare.

Primo. Modificare il file robots.txt del dominio, sperando che la direttiva venga letta / rispettata dai bot:s:

User-agent: *
Disallow: /wp-admin/
Allow: /wp-admin/admin-ajax.php

User-agent: *
Disallow:

User-agent: AdsBot-Google
User-agent: Amazonbot
User-agent: anthropic-ai
User-agent: Applebot
User-agent: AwarioRssBot
User-agent: AwarioSmartBot
User-agent: Bytespider
User-agent: CCBot
User-agent: ChatGPT-User
User-agent: ClaudeBot
User-agent: Claude-Web
User-agent: cohere-ai
User-agent: DataForSeoBot
User-agent: FacebookBot
User-agent: Google-Extended
User-agent: GoogleOther
User-agent: GPTBot
User-agent: ImagesiftBot
User-agent: magpie-crawler
User-agent: Meltwater
User-agent: omgili
User-agent: omgilibot
User-agent: peer39_crawler
User-agent: peer39_crawler/1.0
User-agent: PerplexityBot
User-agent: Seekr
User-agent: YouBot
Disallow: /

Sitemap: https://mywebsite.domanin/sitemap.xml

Secondo. Applicare la seguente modifica al file .htaccess del dominio aggiungendo la seguente sezione:

<IfModule mod_rewrite.c>
RewriteEngine on
RewriteBase /

# block “AI” bots
RewriteCond %{HTTP_USER_AGENT} (AdsBot-Google|Amazonbot|anthropic-ai|Applebot|AwarioRssBot|AwarioSmartBot|Bytespider|CCBot|ChatGPT|ChatGPT-User|Claude-Web|ClaudeBot|cohere-ai|DataForSeoBot|Diffbot|FacebookBot|FacebookBot|Google-Extended|GPTBot|ImagesiftBot|magpie-crawler|omgili|Omgilibot|peer39_crawler|PerplexityBot|YouBot) [NC]
RewriteRule ^ – [F]
</IfModule>

In questo modo di forza la procedura. Diciamo senza dire “per favore”.

Non so se questo basti a risolvere la questione, e si ha un po’ la sensazione che ormai I buoi siano scappati dalla stalla (I primi servizi nascono diversi anni fa). Ancora, non so dire se con lo ‘pseudonimo’ $GenericBot si possa nascondere un nuovo servizio non annunciato al pubblico, o uno dei soliti noti sotto copertura.

Ad ogni modo sono interessato all’argomento. Quindi se ne sai di più fammi sapere.

Letture suggerite del 17 aprile 2023


Le ‘belle’ giornate cominciano, e tra impegni vari salta l’impegno domenicale di scrittura dei post. Sorry for the delay

letture suggerite del 2 aprile 2023

Solo nella loro testa

Un titolo oggi che mi sembra ispirato all’approccio che ha Lucio nel dare un titolo ai propri scritti. Ma non divaghiamo.

Da qualche tempo seguo un blogger tedesco di cui non capisco metà dei post (perché scritti in tedesco, appunto) che come me affronta tematiche Apple ed informatiche in generale. L’altro giorno ha condiviso questo video promozionale di Microsoft che nel proprio canale YouTube promuove l’avvento della funzionalità Copilot [*] nel suo ecosistema applicativo Windows 11 + Office 365. Il video è questo:

Volker nel suo articolo a commento del video esprime un certo scetticismo sulla funzionalità, pensando a come Microsoft stessa rispettando i propri canoni di marketing e commerciali non la renderà disponibile (inizialmente almeno) a realtà casalinghe o professionali, lasciandole relegate al mondo Enterprise. Solo che mediamente i sysadmin Enterprise sono soliti spegnere certe funzionalità estreme, troppo innovative e foriere di problemi.

Senza parlare del fatto che io guardo questi video e dico meh.
Siamo sicuri che questo Copilot produrrà davvero qualcosa di valore? Mi sembra un desiderio quasi puerile come immaginare le auto volanti a guida autonoma nel 2030 come facevo negli anni ’80 da teenager.
Davvero siamo così entusiasti di poter sempre lavorare di copia & incolla, con un editing minimo, su qualcosa? Dov’è il valore che l’impiegato medio apporrà alla sua azienda nell’usare in questa maniera uno strumento informatico?
Non parlo della persona eccellente che saprà piegare al suo volere questi elaborati e la potenza di calcolo. O dell’azienda super innovativa che saprà costruire sulle spalle di questi ‘giganti’ – perché è chiaro che con gli anni questi sistemi si evolveranno se gli investimenti gli arriveranno copiosi e le big tech non escluderanno l’aspetto umanistico ed etico nel progettare questi sitemi.

La middle class dei lavoratori, e delle aziende, che fine farà? Rimpiazzata “dalla macchina” come le daremo dignità e senso di esistere?
Domande per il futuro…

letture suggerite del 26 febbraio 2023


Al momento la mia collezione di appunti per questa rubrica è abbastanza corta, questo vuol dire che rispetto a qualche occasione passata i link proposti sono di pubblicazioni molto recenti. E recentemente in capo tech si è parlato (sin troppo forse) di “intelligenza artificiale” e di come approcciarsi correttamente ad essa. Da qui, la presenza di tre articoli su cinque in questo mio post.
Come sempre, buona lettura!

non si finisce mai di imparare

Le tecnologie per i bambini e per le bambine, come per gli adulti, sono un supporto: dovranno imparare a conviverci, dovranno conoscerle e saperle usare, dovranno imparare a chiedere a un home speaker, così come al prompt di un motore di ricerca qualsiasi (più o meno intelligente che sia), cosa cercano, di cosa hanno bisogno, su cosa possono avere suggerimenti.

Saper chiedere a un robot è, oggi, parimenti importante che sapersi leccare l’indice per sfogliare il Piccolo Palazzi: è acquisire competenze formative che serviranno sempre e in migliaia di contesti diversi.

Luigi Mozzillo

Tutto quello che ho da dire sull’AI

The more I’ve learned about information science, effective information behaviors, the organization of information, information literacy, and the research process, I realize that the common thing uniting all of these things is summarization.

In short, the key skill for making sense of the world of information is developing the ability to concisely and precisely summarize some body of information in your own words.

Trying to replace this learning process with automated tools is the antithesis of intelligence—the value in summarization is not the produced summary as an artifact, but is rather in the act itself of creating the summary.

Scott P. Johnson