Приведенный ниже код преобразует текст в символы с диакритическими знаками. Но он также преобразует теги HTML, которые я хотел бы оставить нетронутыми. Как я могу преобразовать только символы с диакритическими знаками и оставить все остальные специальные символы нетронутыми? Спасибо.
$temp = file_get_contents("file.html");
echo htmlentities($temp,ENT_NOQUOTES,'UTF-8');
<
, и<
). Риск преобразования и мгновенного обратного преобразования заключается в том, что в некоторых случаях части исходного текста могут быть непреднамеренно потеряны. В этом случае<
превратится в<
, а затем все вхождения<
снова преобразуются в<
, включая все вхождения<
в исходном тексте. Однако это не так, потому что сам разделитель сущностей&
также преобразуется! Так что вам не нужно беспокоиться о непреднамеренном преобразовании текста. Звучит довольно очевидно, но я просто напомню. 08.09.2011