in einer UTF-8-Tabelle sind viele Datensätze. Einige haben aber fehlerhafte Strings. Das heißt, dass durch einen Fehlimport diese Strings in A Tilde und dem 2. Multibyte-Zeichen „umgewandelt“ wurden.
Wie kann ich solche Fehler mit einer Abfrage aufspüren?
SELECT *
FROM t_data_altname
where LENGTH(name1)>CHAR_LENGTH(name1)+1
AND (
A Tilde:
name1 like binary ‚%Ã%‘ OR
A Kreis drueber:
name1 like binary ‚%Å%‘ OR
A Umlaut:
name1 like binary ‚%Ä%‘ OR
A Dach
name1 like binary ‚%Â%‘
)
==> A Tilde identifiziert ziemlich eindeutig einen fehlerhaften String
==> die letzten drei identifizieren allerdings nicht eindeutig einen solchen, können aber auch Teil eines fehlerhaften Strings sein