Détecteur et nettoyeur de texte invisible

Outil de détection et suppression de texte invisible

Utilisez cet outil gratuit pour détecter et supprimer tous les caractères Unicode cachés dans votre texte. Les LLM comme ChatGPT peuvent injecter des caractères invisibles, comme les tirets cadratins ou les espaces insécables zéro largeur. Cet outil gratuit permet de les identifier et d'effacer ceux que vous ne souhaitez pas conserver.

🎯 Points clés

✨ Nettoyage en un clic – Identifiez et supprimez facilement tous les caractères Unicode cachés
🔒 Confidentialité garantie – Tout le traitement se fait localement dans votre navigateur, vos données ne quittent jamais votre appareil
❌ Pas de filigrane secret – Les IA comme ChatGPT injectent des caractères cachés, mais ce n'est pas pour du watermarking
📊 Surutilisation de certains caractères – ChatGPT utilise beaucoup certains caractères Unicode "cachés" (comme le tiret cadratin)
⚠️ Risques réels – Les caractères invisibles peuvent causer des problèmes de sécurité et de formatage
🔍 Ne contourne pas les détecteurs – La détection IA reste aussi efficace, même après suppression des caractères cachés
✔️ Suppression automatique des marqueurs data (Nom officiel : HTML custom data attributes - Souvent appelés simplement : data attributes) - Exemple de marqueurs temporels ajoutés par un outil IA ici ChatGpt -data-start="250" data-end="679"

🤔 Que sont les caractères Unicode cachés ?

Les caractères Unicode cachés, qu'ils soient subtilement visibles (tirets cadratins, guillemets courbes, espaces insécables) ou complètement invisibles (espaces de largeur zéro, jointures, marques directionnelles), sont des points de code spéciaux qui ne se comportent pas comme l'ASCII classique.

Ils agissent comme une "encre numérique" qui modifie la façon dont les logiciels gèrent les sauts de ligne, divisent les mots, analysent les données ou comparent le texte, même quand vous ne savez pas qu'ils sont là.

💧 ChatGPT utilise-t-il des caractères cachés comme filigrane ?

Non – Il a été incorrectement rapporté que l'injection de caractères cachés par ChatGPT serait une tentative de "watermarking". Cependant, deux raisons rendent cela très improbable :

Trop facile à contourner – Il suffit de supprimer les caractères pour contourner un filigrane, rendant cette stratégie inutile
OpenAI l'a confirmé – Ils ont déclaré que c'est simplement "une particularité de l'apprentissage par renforcement à grande échelle"

🤖 Les IA injectent-elles vraiment ces caractères ?

Oui – Les LLM comme ChatGPT injectent des caractères cachés. Beaucoup sont inoffensifs (comme le populaire tiret cadratin), tandis que d'autres peuvent causer des problèmes de formatage (espace de largeur zéro).

➖ Tiret cadratin (U+2014)

Le long tiret que ChatGPT insère fréquemment—surtout dans les versions récentes (o3, 4o, 4.1)—pour couper les phrases ou ajouter des pauses dramatiques.

Exemple : mot—mot (ressemble à mot-mot mais est un caractère Unicode distinct)

❝ Guillemets courbes (U+201C, U+201D, U+2018, U+2019)

Les guillemets "typographiques" courbés que ChatGPT substitue parfois aux guillemets droits.

Exemple : "bonjour" ou 'monde'

👻 Espace de largeur zéro (U+200B)

Un caractère d'espacement complètement invisible qui peut se glisser dans le texte lors de la copie depuis ChatGPT.

Peut casser la correspondance de chaînes, les URLs et le comptage de mots

🧠 Pourquoi les IA utilisent-elles ces caractères ?

Biais des données d'entraînement – Les IA s'entraînent sur des textes professionnels où ces caractères sont standard
Imitation du ton formel – Ces caractères aident les IA à paraître plus formelles et autoritaires
Pas de clavier physique – Les IA ne "tapent" pas avec un clavier, donc utiliser ces caractères ne leur demande aucun effort supplémentaire

⚠️ Usages courants et préoccupations

✅ Pourquoi les utiliser ?

Mise en page propre – Contrôle des sauts de ligne
Noms d'utilisateur – Contourner les restrictions "pas d'espace"
Filigranes subtils – Protection du contenu

❌ Pourquoi s'inquiéter ?

Formatage cassé – Même apparence, comportement différent
Sécurité – Cache du code malveillant
Prompts piégés – Instructions cachées dans les prompts IA
Détection IA – Le formatage révèle l'origine IA du texte

📋 87+ caractères détectés

Notre outil détecte et traite 87+ caractères Unicode invisibles, incluant :

Espaces Unicode

U+00A0 à U+3000

Marques directionnelles

U+200E à U+202E

Jointures invisibles

U+200B à U+200D

Texte à analyser

Vue texte

Vue HTML

0/1500 mots

Caractères cachés révélés et surlignés

Afficher espaces

Afficher non-clavier

Afficher Unicode

Notre outil détecte et traite 87 caractères Unicode différents.

#	Unicode	Visibilité	Description
1	U+0020	Visible	Espace normale
2	U+00A0	Visible	Espace insécable
3	U+0009	Visible	Tabulation
4	U+000A	Visible	Saut de ligne (LF)
5	U+000C	Visible	Saut de page
6	U+001C	Visible	Séparateur de fichier
7	U+000D	Visible	Retour chariot (CR)
8	U+2000	Visible	Cadratin demi-cadratin
9	U+2001	Visible	Cadratin plein
10	U+2002	Visible	Espace demi-cadratin
11	U+2003	Visible	Espace cadratin
12	U+2004	Visible	Espace tiers de cadratin
13	U+2005	Visible	Espace quart de cadratin
14	U+2006	Visible	Espace sixième de cadratin
15	U+2007	Visible	Espace de chiffre
16	U+2008	Visible	Espace de ponctuation
17	U+2009	Visible	Espace fine
18	U+200A	Visible	Espace ultrafine
19	U+202F	Visible	Espace insécable étroite
20	U+205F	Visible	Espace mathématique
21	U+3000	Visible	Espace idéographique
22	U+1680	Visible	Espace Ogham
23	U+200B	Invisible	Espace de largeur nulle
24	U+200C	Invisible	Anti-liant sans chasse
25	U+200D	Invisible	Liant sans chasse
26	U+200E	Invisible	Marque gauche-à-droite
27	U+200F	Invisible	Marque droite-à-gauche
28	U+202A	Invisible	Début gauche-à-droite
29	U+202B	Invisible	Début droite-à-gauche
30	U+202C	Invisible	Fin directionnelle
31	U+202D	Invisible	Forçage gauche-à-droite
32	U+202E	Invisible	Forçage droite-à-gauche
33	U+2060	Invisible	Liant de mot
34	U+2061	Invisible	Application de fonction
35	U+2062	Invisible	Multiplication invisible
36	U+2063	Invisible	Séparateur invisible
37	U+2064	Invisible	Addition invisible
38	U+2066	Invisible	Isolat gauche-à-droite
39	U+2067	Invisible	Isolat droite-à-gauche
40	U+2068	Invisible	Premier isolat fort
41	U+2069	Invisible	Fin d'isolat directionnel
42	U+206A	Invisible	Inhiber inversion symétrique
43	U+206B	Invisible	Activer inversion symétrique
44	U+206C	Invisible	Inhiber forme arabe
45	U+206D	Invisible	Activer forme arabe
46	U+206E	Invisible	Chiffres forme nationale
47	U+206F	Invisible	Chiffres forme nominale
48	U+2028	Invisible	Séparateur de ligne
49	U+2029	Invisible	Séparateur de paragraphe
50	U+2014	Visible	Tiret cadratin
51	U+2013	Visible	Tiret demi-cadratin
52	U+2019	Visible	Apostrophe typographique
53	U+201C	Visible	Guillemet ouvrant double
54	U+201D	Visible	Guillemet fermant double
55	U+2018	Visible	Guillemet ouvrant simple
56	U+2026	Visible	Points de suspension
57	U+00AD	Invisible	Trait d'union conditionnel
58	U+034F	Invisible	Liant de graphème
59	U+2800	Visible	Espace Braille
60	U+3164	Visible	Remplissage Hangul
61	U+115F	Visible	Remplissage Hangul Choseong
62	U+1160	Visible	Remplissage Hangul Jungseong
63	U+17B4	Visible	Voyelle inhérente Khmer AQ
64	U+17B5	Visible	Voyelle inhérente Khmer AA
65	U+180B	Invisible	Sélecteur variation mongol 1
66	U+180C	Invisible	Sélecteur variation mongol 2
67	U+180D	Invisible	Sélecteur variation mongol 3
68	U+180E	Visible	Séparateur voyelle mongol
69	U+FE00	Invisible	Sélecteur de variation 1
70	U+FE01	Invisible	Sélecteur de variation 2
71	U+FE02	Invisible	Sélecteur de variation 3
72	U+FE03	Invisible	Sélecteur de variation 4
73	U+FE04	Invisible	Sélecteur de variation 5
74	U+FE05	Invisible	Sélecteur de variation 6
75	U+FE06	Invisible	Sélecteur de variation 7
76	U+FE07	Invisible	Sélecteur de variation 8
77	U+FE08	Invisible	Sélecteur de variation 9
78	U+FE09	Invisible	Sélecteur de variation 10
79	U+FE0A	Invisible	Sélecteur de variation 11
80	U+FE0B	Invisible	Sélecteur de variation 12
81	U+FE0C	Invisible	Sélecteur de variation 13
82	U+FE0D	Invisible	Sélecteur de variation 14
83	U+FE0E	Invisible	Sélecteur de variation 15
84	U+FE0F	Invisible	Sélecteur de variation 16
85	U+FEFF	Invisible	Espace insécable zéro / BOM
86	U+FFA0	Visible	Remplissage Hangul demi-chasse
87	U+FFFC	Visible	Remplacement d'objet

Analyse des caractères

Caractères non-clavier

Nombre de caractères

Nombre de mots

Attributs HTML

data: 0 class: 0 id: 0 title: 0

Typographie

Guillemets, tirets, etc.