02/01/2025

Ce blog et les LLM

Rien de ce qui est accessible sur ce domaine ne peut être utilisé pour alimenter des LLM, simplement parce que je le refuse.

On est en janvier et comme je le disais hier j'ai l'intention de continuer sur la trajectoire de resurrection de ce blog entamée en 2024, donc d'écrire beaucoup plus. Seulement voilà : j'écris pour des gens, pas pour du capital. Or s'il y a bien quelque chose qui excite le capital ces dernières années c'est les LLM, les annonces sont grandioses et les valorisations encore plus.

Je suis propriétaire de tout ce que j'écris, par la simple vertu d'en être l'auteur. Je publie moi-même donc nous ne sommes pas ici dans un situation où en utilisant une plateforme j'aurais cédé mes droits à Facebook ou similaire.

Comme je suis l'auteur et que je détiens les droits je suis libre de décider au cas par cas comment on peut utiliser mes textes. C'est ainsi que j'ai décidé que certains articles seraient sous license Creative Commons, en particulier CC-BY (tu peux l'utiliser dans ton travail mais il faut me citer), CC-BY-SA (la même mais en plus ton dérivé devra porter la même license), ou CC-BY-NC (la même mais je t'interdis un usage commercial).

Tout le reste est sous license "VA CHIER C'EST À MOI".

Ça devrait être l'évidence mais le monde est devenu con donc on va le répéter : ce n'est pas parce que c'est publié que c'est libre de droits. Je suis le détenteur des droits, je me les réserve. Si tu as besoin de droits sur mon travail je suis joignable et nous pouvons discuter.

Il y a beaucoup de choses qu'on peut reprocher aux LLM en tous genres, même s'ils peuvent éventuellement avoir une utilité dans l'un ou l'autre usage de niche. Il y a l'impact environnemental, la merdification du Web accélérée par ces générateurs de textes plausibles, les dangers de la prolifération de textes plausibles dans la forme mais incorrects dans le fond, l'amplification de biais, et bien entendu les problèmes éthiques.

Là où je deviens particulièrement tendu c'est quand je vois des OpenAI et consorts faire du scraping massif à très grande échelle pour fabriquer leurs perroquets stochastiques, au mépris le plus total du droit d'auteur et des robots.txt. Ils pompent littéralement tout le Web pour en faire des machins qu'ils vendent, et quand on leur dit que c'est quand même pas cool de ne pas rémunérer les auteurs qui rendent possible tout ça ils répliquent que les LLM ne peuvent pas être commercialement rentables si on rémunère les auteurs. Tout simplement.

Donc demain je vais aller voler une Ferrari, dire que je ne peux pas la payer parce que je n'en ai pas les moyens donc je la vole, et on va me dire "ah oui OK, ben fais donc" au nom d'une prétendue innovation. Non, c'est pas comme ça que ça marche ? En effet, ce n'est pas comme ça que ça marche.

Donc pour clarifier :

Comme ça c'est clair.


Tags:

ia | jkb.log


Le bug du 31/12/2024, disponible également sur OneWeb (03/01/2025)C'est reparti pour un tour (01/01/2025)