Как исправить появившиеся иероглифы. Структура иероглифа: черты, графемы, сложные знаки

У некоторых людей случаются проблемы с кодировкой на сайте/сервере из-за чего вместо русского текста появляются иероглифы вида:

Почему это происходит?

Одной из причин происхождения является тот факт, что у вас установлены разные кодировки вывода данных (текста) в PHP / MySQL / Html / Файлах. По правде... Это единственная причина по которой у вас иероглифы.. Осталось разобраться только откуда именно поступает неправильная кодировка. Например, может быть что в PHP, Html, Файлах кодировка UTF-8, а в MySQL win-1251 и из-за этого у вас проблемы.

Как решить проблему с иероглифами возникающими вместо русского текста?

Что ж для того что бы решить проблему не мороча себе голову выставьте везде кодировку UTF-8.

1 . Файл сайта должен быть сохранён в UTF-8.

2. В HTML между тэгами и добавьте строку:

http-equiv ="content-type " content ="text/html; charset=utf-8 " />

3. В PHP файле перед вывод каких-либо HTML частей, вставьте строку:

header("Content-Type: text/html; charset=utf-8");

Можно сию строку поставить и в начале файла.

4. И конечно MySQL... Тут дело затяжней.

Нередко бывают случаи когда все данные отображаются правильно, по русски короме тех которые хранятся и выводятся на страницу из базы данных MySQL, в этом случае это естественно проблемы только БД и предыдущие 3 шага выполнять необязательно.

Т.к я не знаю вашей ситуации то предположу:

4.1. У вас в MySQL все данные записываются в неверной кодировке.

Для того что бы убедиться в этом или обратном воспользуйтесь PhpMyAdmin и собственноручно проверьте базу. Если в ней записи в отличном "русском" состоянии, значит с кодировкой данных в базе всё нормально и остаётся только неправильная кодировка вывода данных из MySQL. Если же действительно в базе билиберда и полно иероглифов, то сделайте следующее:

В PhpMyAdmin выберите используемую БД, затем справа выберите вкладку "Операции", и в самом низу "Сравнение" Поставьте utf8_general_ci .

4.2 . У вас неправильная кодировка вывода данных из MySQL .

В том случае если у вас в базе всё по русски а вот выводит данные она иероглифани, значит проблемы именно с выводом. Для решения этой проблемы, убедитесь что перед выводом чего-либо из базы в PHP файле присутствуют такие строки:

mysql_query("SET NAMES utf8");
mysql_query("SET CHARACTER SET utf8");
mysql_query("SET COLLATION_CONNECTION="utf8_general_ci"");

Доброго дня.

Наверное, каждый пользователь ПК сталкивался с подобной проблемой: открываешь интернет-страничку или документ Microsoft Word - а вместо текста видишь иероглифы (различные «крякозабры», незнакомые буквы, цифры и т.д. (как на картинке слева…)).

Хорошо, если вам этот документ (с иероглифами) не особо важен, а если нужно обязательно его прочитать?! Довольно часто подобные вопросы и просьбы помочь с открытием подобных текстов задают и мне. В этой небольшой статье я хочу рассмотреть самые популярные причины появления иероглифов (разумеется, и устранить их).

Иероглифы в текстовых файлах (.txt)

Самая популярная проблема. Дело в том, что текстовый файл (обычно в формате txt, но так же ими являются форматы: php, css, info и т.д.) может быть сохранен в различных кодировках .

Кодировка - это набор символов, необходимый для того, чтобы полностью обеспечить написание текста на определенном алфавите (в том числе цифры и специальные знаки). Более подробно об этом здесь: https://ru.wikipedia.org/wiki/Набор_символов

Чаще всего происходит одна вещь: документ открывается просто не в той кодировке из-за чего происходит путаница, и вместо кода одних символов, будут вызваны другие. На экране появляются различные непонятные символы (см. рис. 1)…

Рис. 1. Блокнот - проблема с кодировкой

Как с этим бороться?

На мой взгляд лучший вариант - это установить продвинутый блокнот, например Notepad++ или Bred 3. Рассмотрим более подробно каждую из них.

Notepad++

Один из лучших блокнотов как для начинающих пользователей, так и для профессионалов. Плюсы: бесплатная программа, поддерживает русский язык, работает очень быстро, подсветка кода, открытие всех распространенных форматов файлов, огромное количество опций позволяют подстроить ее под себя.

В плане кодировок здесь вообще полный порядок: есть отдельный раздел «Кодировки» (см. рис. 2). Просто попробуйте сменить ANSI на UTF-8 (например).

После смены кодировки мой текстовый документ стал нормальным и читаемым - иероглифы пропали (см. рис. 3)!

Рис. 3. Текст стал читаемый… Notepad++

Bred 3

Еще одна замечательная программа, призванная полностью заменить стандартный блокнот в Windows. Она так же «легко» работает со множеством кодировок, легко их меняет, поддерживает огромное число форматов файлов, поддерживает новые ОС Windows (8, 10).

Кстати, Bred 3 очень помогает при работе со «старыми» файлами, сохраненных в MS DOS форматах. Когда другие программы показывают только иероглифы - Bred 3 легко их открывает и позволяет спокойно работать с ними (см. рис. 4).

Если вместо текста иероглифы в Microsoft Word

Самое первое, на что нужно обратить внимание - это на формат файла. Дело в том, что начиная с Word 2007 появился новый формат - «docx » (раньше был просто «doc «). Обычно, в «старом» Word нельзя открыть новые форматы файлов, но случается иногда так, что эти «новые» файлы открываются в старой программе.

Просто откройте свойства файла, а затем посмотрите вкладку «Подробно » (как на рис. 5). Так вы узнаете формат файла (на рис. 5 - формат файла «txt»).

Если формат файла docx - а у вас старый Word (ниже 2007 версии) - то просто обновите Word до 2007 или выше (2010, 2013, 2016).

Далее при открытии файла обратите внимание (по умолчанию данная опция всегда включена, если у вас, конечно, не «не пойми какая сборка») - Word вас переспросит: в какой кодировке открыть файл (это сообщение появляется при любом «намеке» на проблемы при открытии файла, см. рис. 5).

Рис. 6. Word - преобразование файла

Чаще всего Word определяет сам автоматически нужную кодировку, но не всегда текст получается читаемым. Вам нужно установить ползунок на нужную кодировку, когда текст станет читаемым. Иногда, приходится буквально угадывать, в как был сохранен файл, чтобы его прочитать.

Рис. 8. браузер определил неверно кодировку

Чтобы исправить отображение сайта: измените кодировку. Делается это в настройках браузера:

  1. Google chrome: параметры (значок в правом верхнем углу)/дополнительные параметры/кодировка/Windows-1251 (или UTF-8);
  2. Firefox: левая кнопка ALT (если у вас выключена верхняя панелька), затем вид/кодировка страницы/выбрать нужную (чаще всего Windows-1251 или UTF-8) ;
  3. Opera: Opera (красный значок в верхнем левом углу)/страница/кодировка/выбрать нужное.

PS

Таким образом в этой статье были разобраны самые частые случаи появления иероглифов, связанных с неправильно определенной кодировкой. При помощи выше приведенных способов - можно решить все основные проблемы с неверной кодировкой.

Буду благодарен за дополнения по теме. Good Luck 🙂

Всем привет!

Посмотрел по у скольких людей есть проблемы с отображением текста (тот вылезает в виде иероглифов) и решил написать данную статью-заметку. Она будет короткая и попросту расскажет, из-за чего в 99% случаев возникает эта проблема и как ее решить. Поехали.

Совершенно не важно, у Вас собственный сайт или простой вордовский документ. Иероглифы вместо нормального русского текста могут отображаться абсолютно везде. А проблема одна. Кодировка. Чаще всего используется utf-8, но так же иногда любят использовать и windows-1251. Так вот, если у Вас сервер работает на utf-8, а сайт заточен под windows-1251 - вместо текста будут иегорлифы.

Решение: необходимо файлы сайта сохранить с преобразованием кодировки в utf-8 без BOM . Есть 2 типа, с BOM и без него. Отличие в том, что в простом utf-8 в начало строки подставляются всякие лишние значения, от чего и вес возрастает, и отображается не так, как надо. Поэтому используем только без bom.

Также убедитесь, что в начале сайта в коде, там где блок, в строке charset будет стоять либо utf-8, либо этой строки вообще не будет. После чего сайт начнет отображаться как надо.

В документах вместо текста отображаются иероглифы

Если у Вас такая же проблема с документами - меняйте кодировку. Только в данном случае экспериментируйте. Поставьте сначала utf-8, если не подойдет - windows-1251. Если и так не сработает - попробуйте еще какую-нибудь из раздела кирилитических кодировок. Если не поможет - возможно, файл испорчен. Либо есть еще какая-то проблема. Но в 99% случаев помогает смена кодировки.

Принтер печатает вместо текста иероглифы

Тоже довольно распространенная проблема. Что делать, я думаю, Вы уже догадались. Идем в раздел настроек принтера. Там где-то должен быть раздел "Кодировки". Ищем такой. И смотрим что за кодировка стоит. Если utf-8, пробуем изменить на windows-1251. А вот уж если стоит windows-1251, тогда пробуем ставить utf-8.

Вот и все. Теперь мы знаем, по какой причине появляются иероглифы вместо текста и как с этим бороться.

Вопрос пользователя

Здравствуйте.

Подскажите пожалуйста, почему у меня некоторые странички в браузере отображают вместо текста иероглифы, квадратики и не пойми что (ничего нельзя прочесть). Раньше такого не было.

Заранее спасибо...

Доброго времени суток!

Действительно, иногда при открытии какой-нибудь интернет-странички вместо текста показываются различные "крякозабры" (как я их называю), и прочитать это нереально.

Происходит это из-за того, что текст на страничке написан в одной кодировке (более подробно об этом можете узнать из ), а браузер пытается его открыть в другой. Из-за такого рассогласования, вместо текста - непонятный набор символов.

Попробуем исправить это...

Исправляем иероглифы на текст

Браузер

Вообще, раньше Internet Explorer часто выдавал подобные крякозабры, современные же браузеры (Chrome, Яндекс-браузер, Opera, Firefox) - довольно неплохо определяет кодировку, и ошибаются очень редко. Скажу даже больше, в некоторых версиях браузера уже убрали выбор кодировки, и для "ручной" настройки этого параметра нужно скачивать дополнения, или лезть в дебри настроек за 10-ток галочек...

И так, предположим браузер неправильно определили кодировку и вы увидели следующее (как на скрине ниже)...

Чаще всего путаница бывает между кодировками UTF (Юникод) и Windows-1251 (большинство русскоязычных сайтов выполнены в этих кодировках).

  1. нажать левый ALT - чтобы сверху показалось меню. Нажать меню "Вид";
  2. выбрать пункт "Кодировка текста" , далее выбрать Юникод . Вуаля - иероглифы на странички сразу же стали обычным текстом (скрин ниже)!

Еще один совет : если в браузере не можете найти, как сменить кодировку (а дать инструкцию для каждого браузера - вообще нереально!), я рекомендую попробовать открыть страничку в другом браузере. Очень часто другая программа открывает страницу так, как нужно.

Текстовые документы

Очень много вопросов по крякозабрам задаются при открытии каких-нибудь текстовых документов. Особенно старых, например при чтении Readme в какой-нибудь программе прошлого века (например, к играм).

Разумеется, что многие современные блокноты просто не могут прочитать DOS"овскую кодировку, которая использовалась ранее. Чтобы решить сию проблему, рекомендую использовать редактор Bread 3.

Bred 3

Простой и удобный текстовый блокнот. Незаменимая вещь, когда нужно работать со старыми текстовыми файлами. Bred 3 за один клик мышкой позволяет менять кодировку и делать не читаемый текст читаемым! Поддерживает кроме текстовых файлов довольно большое разнообразие документов. В общем, рекомендую!

Попробуйте открыть в Bred 3 свой текстовый документ (с которым наблюдаются проблемы). Пример показан у меня на скрине ниже.

Для работы с текстовыми файлами различных кодировок так же подойдет еще один блокнот - Notepad++. Вообще, конечно, он больше подходит для программирования, т.к. поддерживает различные подсветки, для более удобного чтения кода.

Пример смены кодировки показан ниже: чтобы прочитать текст, достаточно в примере ниже, достаточно было сменить кодировку ANSI на UTF-8.

WORD"овские документы

Очень часто проблема с крякозабрами в Word связана с тем, что путают два формата Doc и Docx . Дело в том, что с 2007 Word (если не ошибаюсь) появился формат Docx (позволяет более сильнее сжимать документ, чем Doc, да и надежнее защищает его).

Так вот, если у вас старый Word, который не поддерживает этот формат - то вы, при открытии документа в Docx, увидите иероглифы и ничего более.

Решения есть 2:

  1. скачать на сайте Microsoft спец. дополнение, которое позволяет открывать в старом Word новые документы. Только из личного опыта могу сказать, что открываются далеко не все документы, к тому же сильно страдает разметка документа (что в некоторых случаях очень критично);
  2. использовать аналоги Word (правда, тоже разметка в документе будет страдать);
  3. обновить Word до современной версии.

Так же при открытии любого документа в Word (в кодировке которого он "сомневается"), он на выбор предлагает вам самостоятельно указать оную. Пример показан на рисунке ниже, попробуйте выбрать:

  1. Widows (по умолчанию);
  2. MS DOS;
  3. Другая...

Окна в различных приложениях Windows

Бывает такое, что какое-нибудь окно или меню в программе показывается с иероглифами (разумеется, прочитать что-то или разобрать - нереально).

  1. Руссификатор. Довольно часто официальной поддержки русского языка в программе нет, но многие умельца делают руссификаторы. Скорее всего, на вашей системе - данный руссификатор работать отказался. Поэтому, совет простой: попробовать поставить другой;
  2. Переключение языка. Многие программы можно использовать и без русского, переключив в настройках язык на английский. Ну в самом деле: зачем вам в какой-то утилите, вместо кнопки "Start" перевод "начать"?
  3. Если у вас раньше текст отображался нормально, а щас нет - попробуйте восстановить Windows, если, конечно, у вас есть точки восстановления (подробно об этом здесь - );
  4. Проверить настройки языков и региональных стандартов в Windows, часто причина кроется именно в них.

Языки и региональные стандарты в Windows

Чтобы открыть меню настроек:

  • нажмите Win+R ;
  • введите intl.cpl , нажмите Enter.

intl.cpl - язык и регион. стандарты

Проверьте чтобы во вкладке "Форматы" стояло "Русский (Россия) // Использовать язык интерфейса Windows (рекомендуется)" (пример на скрине ниже).

Во вкладке местоположение поставьте расположение Россия.

И во вкладке дополнительно установите язык системы на "Русский (Россия)". После этого сохраните настройки и перезагрузите ПК. Затем вновь проверьте, нормально ли отображается интерфейс нужной программы.

И напоследок, наверное, для многих это очевидно, и все же некоторые открывают определенные файлы в программах, которые не предназначены для этого: к примеру в обычном блокноте пытаются прочитать файл DOCX или PDF. Естественно, в этом случае вы вместо текста будут наблюдать за крякозабрами, используйте те программы, которые предназначены для данного типа файла (WORD 2007+ и Adobe Reader для примера выше).

На сим всё, удачи!



В продолжение темы:
Android

Популярная социальная сеть ВКонтакте позволяет находить новых друзей и держать контакт со всеми близкими. Помимо этого, каждый пользователь может делиться собственными...