this post was submitted on 16 Nov 2023
11 points (86.7% liked)

France

2186 readers
162 users here now

La France et les Français

Communautés principales

Nous rejoindre sur Matrix: https://matrix.to/#/#jlai.lu:matrix.org

🔍 Recherche

FAQ, guides et ressources :

Actualité internationale

Loisirs:

Vie Pratique:

Société:

Villes/Régions

Pays:

Humour:

Fedivers:

Règles

  1. Multi-lingual community: posts in other language than French are allowed. 🚀

  2. Tous les francophones sont bienvenus. 🐌

  3. Remember the human : pas d’insultes, pas d’agressivité, pas de harcèlement entre utilisateurs. 🤖

  4. Xénophobie, racisme et autre forme de discrimination sont interdits.🌈

  5. Pas de doublon. Pas de spam. Évitez les paywalls autant que possible.☔

  6. Utilisez la fonction "Report" pour signaler le contenu contrevenant aux règles.🏴

  7. Le contenu doit être en rapport avec la France ou la population française.🇨🇵


Communauté de secours:

founded 1 year ago
MODERATORS
 

(cross-post de ce post sur le sub open source)

Bonjour à tous 😊

Je viens "faire ma pub" pour vous présenter Redakt.

Redakt est un outil open source qui permet de chiffrer un contenu textuel afin de le publier publiquement sur les réseaux sociaux ou n'importe quelle plateforme. Seuls les utilisateurs ayant l'extension Redakt peuvent lire ce texte.

L'objectif est de limiter l'exposition des contenus que nous publions publiquement sur internet à ces innombrables robots qui scrappe et utilisent nos contenus pour diverses raisons (légitimes ou illégitimes).

L'idée est d'ajouter une touche de "privacy" lorsque nous publions un post, un commentaire ou un message sur un réseau social type Twitter, Facebook, Reddit, etc. Ainsi, votre contenu bénéficie d'un hébergement gratuit, mais n'est pas compréhensible par la plateforme sur laquelle vous le publiez.

Si vous voulez tester, voici le lien pour installer l'extension (Chrome/Brave) : https://redakt.org/browser/

Je posterai un commentaire "redakté" en bas, pour que vous puissiez le déchiffrer.

PS: Pour les intéressés, le lien du repo sur GitHub: https://redakt.org/github/

you are viewing a single comment's thread
view the rest of the comments
[–] Camus@lemmy.ca 5 points 11 months ago (2 children)

Merci pour le partage !

Intéressant pour contrer les bots, après est-ce qu'ils ne peuvent pas eux-mêmes utiliser l'extension pour parser le contenu ?

[–] touzovitch@jlai.lu 5 points 11 months ago (1 children)

Très bonne question ! Dans le contexte actuel ils ne le font pas (trop occuper à agréger des millions de data-point en clair).

Si les bots s'adaptent (et ils le feront si Redakt est utilisé par une quantité significative d'utilisateurs) alors c'est une course.

L'objectif est de mettre des batons dans les roues de la collecte massive de données "at scale". En effet une petite modification dans la manière de chiffrer de Redakt obligerait les bots à s'adapter, hors ce n'est pas scalable.

[–] Camus@lemmy.ca 2 points 11 months ago

Je vois, merci !

[–] magnor@lemmy.magnor.ovh 3 points 11 months ago (1 children)

Je suis d'accord. Faire tourner un bot avec un headless-chrome est relativement trivial de nos jours, et très courant. Que loupé-je ?

[–] touzovitch@jlai.lu 1 points 11 months ago (1 children)

En effet c'est assez trivial si on le compare à du chiffrement E2E qui sécurise aujourd'hui nos communications privées (WhatsApp, Signal, etc.).

Mais Redakt tente d'ajouter une touche de "privacy" dans un contexte de collecte massive de communication publique.

Prenons ce forum par exemple. Il sera très certainement scrappé puis utilisé pour entrainé des versions futures de ChatGPT.

Si chaque posts de ce forum était "redakted", cela obligerait les data engineers d'OpenAI d'adapté leur dataset face à un flux de données toujours plus hétérogènes à mesure que Redakt change ses méthodes de chiffrement.

Bien sur, je compte ajouter des options de chiffrement plus complexes dans les versions futures de Redakt. Ainsi les utilisateurs pourraient choisir le niveau de chiffrement de leur contenu.

[–] magnor@lemmy.magnor.ovh 4 points 11 months ago (1 children)

En l'occurrence ce n'est pas ma question. Je reformule : de nombreux scrappers passent par des versions headless de chrome pour éviter d'être identifiés comme bots. Ils pourraient donc installer l'extension et lire les posts chiffrés comme un utilisateur lambda. Du coup, qu'est ce qui empêcherait cela ?

[–] touzovitch@jlai.lu 2 points 11 months ago* (last edited 11 months ago) (1 children)

Oups, j'avais mal compris. Je me reprends.

En effet, ils pourraient le faire. Si c'est le cas, l'ajout d'un simple captcha rendrait leur méthode obsolète et les empêcherait donc de "scale".

Je ne dis pas que cette méthode est impénétrable. Le but est d'apporter un moyen qui empêcherait le data mining à l'échelle actuelle.

Le moindre petit changement sur l'extension de Redakt (captcha, input, output, méthode de chiffrement) n'aurait aucun effet sur l'expérience des vrais utilisateurs, mais obligerait les scrappeurs à s'adapter constamment et leur demanderait des ressources (humaine + machine) conséquentes pour mettre à l'échelle.

[–] magnor@lemmy.magnor.ovh 1 points 11 months ago (1 children)

Je vois, merci de cette réponse. Cependant les bots sont meilleurs aux captchas que les humains désormais... Je suis d'accord qu'il est possible de leur rendre la vie difficile mais j'ai peur qu'à ce jeu de chat et souris un développeur seul soit perdant d'avance (ceci dit avec empathie, pas mépris !).

[–] touzovitch@jlai.lu 2 points 11 months ago (1 children)

Oui en effet moi tout seul ça risque de faire un peu short :p

Rendre leur vie difficile c'est déjà bien. Redakt est surtout adapté dans un context de publication contenu publique sur Internet. Je ne me fais pas d'illusion, par définition aucun contenu public ne peut être incassable très longtemps.

[–] magnor@lemmy.magnor.ovh 2 points 11 months ago (1 children)

Je suis 100% pour leur rendre la vie difficile. Mon inquiétude est plus que la on risque de plus compliquer la vie des gens que celles des corpos. Mais Je peux me tromper.

[–] touzovitch@jlai.lu 2 points 11 months ago (1 children)

Alors le challenge sera de rendre l'encryption et la decryption la plus fluide possible. La decryption est zero-clic donc c'est déjà pas trop mal. Bien sûr, il y a encore beaucoup de travail.

Comme souvent avec la Privacy, l'objéctif est de donner un choix et rendre la Privacy moins binaire (public VS privé). L'objéctif est de proposer un éventail de choix de chiffrement/offuscation à chaque fois qu'un utilisateur souhaite publier un contenu en ligne.

[–] magnor@lemmy.magnor.ovh 2 points 11 months ago

Zero click si on est 1. Sur un navigateur 2. avec l'extension installée.

Sur la question du choix je suis d'accord, plus c'est mieux.